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A ' Prefáci 
j reiąacio 
Copyright © 1971 da Editora McGraw-Hill do Brasil, Ltda. 5 
arte dest: blicação poderá ser reproduzida, guar- af : na ; 7 A 
dido Ca o E ranemitida de qualquer modo ou A Estatística, ou métodos estatísticos, como é denominada algumas vêzes, deseri- 
por qualquer outro meio, seja este eletrônico, mecânico, de fotocópia, penha papel crescente e importante em quase tôdas as fases da pesquisa humana. Lidando 


de gravação, ou outros, sem prévia autorização por escrito da Editora. anteriormente apenas com os negócios de Estado, donde o seu nome, a influência da 


estatística estendeu-se agora à agricultura, biologia, comércio, química, comunicações, 

economia, educação, eletrônica, medicina, física, ciências políticas, psicologia, sociologia 

2a rei ssão 1971 e outros numerosos campos da ciência e engenharia, 
à reimpre: K 

8.2 reimpressão 1971 x 


A finalidade dêste livro é apresentar uma introdução aos princípios gerais da Estatis- 
4.a reimpressão 1972 i 


tica que serão úteis a todos os indivíduos, qualquer que seja seu câmpo de especialização. 
5.2 reimpressão 1972 E Foi planejado para ser utilizado para suplementar os livros texto-padrão usuais ou como 
62 reimpressão 1974 livro texto dè um curso regular de estatística. Pode ser. também de valor. considerável 
72 reimpressão 1974 t como livro de consulta para aquêles que presentemente se empenham nas aplicações 
82 reimpressão 1975 | da Estatística aos seus problemas especiais de pesquisa. 


Cada capítulo começa-com a exposição clara das definições pertinentes, teoremas 
e princípios, juntamente com ilustrações e outras matérias descritivas, Isto é, seguido 
de séries graduadas de problemas resolvidos e suplementares que, em muitos casos, 
utilizam dados retirados de situações estatísticas recentes. O problema resolvido serve 
para ilustrar e ampliar a teoria, focalizando incisivamente aquêles pontos sutis sem os 
quais o estudante sghtir-se-ia constantemente sem base segura, e proporciona a repetição 
dos princípios básicos, tão vitais para o ensino efetivo. Numerosas deduções de fórmulas 
estão incluídas entre os problemas resolvidos. O grande número de problemas suple- 
mentares com respostas serve para uma revisão completa da matéria de cada capítulo. 


i 
TAG } Os únicos conhecimentos matemáticos necessários para compreensão de todo o 


Tod direitos para a lingua portuguesa resevados pela f livro é a aritmética e elementos de álgebra. Uma revisão dos conceitos matemáticos 
todos 08 res j : 


| importantes usados neste livro é apresentada no primeiro capítulo, que pode ser lido 
EDITORA McGRAW-HILL DO BRASIL, LTDA. $ no comêço do curso ou consultado posteriormente, à medida que surjam as dificuldades. 
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A parte inicial do livro trata da análise da distribuição de frequência e das medidas 
correlatas da tendência central, dispersão, assimetria e achatamento (curtose). Isto 
conduz naturalmente à discussão da teoria elementar de probabilidade e suas aplicações, 
o que nos facilita o caminho para o estudo da teoria de amostragem, As técnicas da 

teoria das grandes amostras, a qual envolve a distribuição normal, as aplicações de 

MINAS GERAIS RIO GRANDE DO SUL estimação estatística e-os testes de hipótese e significação são tratados primeiramente. 
camera ssa emma f A teoria das pequenas amostras, que envolve as distribuições de Student (distribuição 2) 

Impresso no Brasil i e qui quadrado (distribuição x9, juntamente com suas aplicações, segue em capítulos 
Printed in Brazil g pit separados. Um capítulo sôbre o ajustamento de curvas e o método dos mínimos qua- 
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drados, é qual é por si mesmo interessante, conduz lôgicamente aos tópicos da correlação 
e da regressão que envolvem duas variáveis. A correlação múltipla e a parcial, que envol- 
vem mais de duas variáveis, são tratadas em capítulos separados. Os dois capitulos 
finais tratam da análise das séries temporais e dos números índices, respectivamente. 


Foi incluído neste livro, em grande escala, muito mais assunto do que o que consta 
da mwioria dos cursos elementares. Isto foi feito para torná-lo mais flexível, para pro- 
porcionar uma fonte de consulta mais proveitosa e para estimular o interêsse futuro 
sôbre os assuntos. Ao utilizar o livro, é possível trocar a ordem de alguns capitulos pos- 
teriores ou mesmo omitir alguns sem embaraços. Por exemplo, os capítulos Bel7 
podem ser geralmente apresentados imediatamente após o capítulo 5, se se desejar tratar 
de correlação, repressão, séries temporais e números índices antes da teoria da amostragem. 
Semelhantemente, a maior parte do capítulo 6 pode ser omitida por quem não deseja 
dedicar muito tempo à probabilidade. Em um curso elementar todo o capítulo 5 pode 
ser omitido, Foi usada a presente ordem porque há uma tendência crescente nos cursos 
modernos em apresentar a teoria da amostragem e a inferência estatística o mais cedo 
possível. n 
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com Oliver and Boy Ltd, Edinburgh, pela licença concedida para usar os dados da tabela 
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VARIÁVEIS E GRÁFICOS 


Estatística 


A estatística está interessada nos métodos científicos para coleta, 
organização, resumo, apresentação e análise de dados bem como 
na obtenção de conclusões válidas e na tomada de decisões razoáveis 
baseadas em tais análises. 


Em sentido mais restrito, o têrmo é usado. para designar os 
próprios dados ou múmeéros dêles derivados como, por exemplo, | 
médias. Assim, falamos em estatística de empregos, de acidentes, ete. 


População e amostra. Estatística indutiva e descritiva 


Ao coletar os dados referentes às características de um grupo 
de objetos ou indivíduos, tais como as alturas e pesos dos estu- 
dantes de uma universidade ou os números de parafusos defeituosos 
ou não produzidos por uma fábrica em um certo dia, é muitas vêzes 
impossível ou impraticável observar todo o grupo, especialmente se 
fôr muito grande. Em vez de examinar todo o grupo, denominadó 
população ou universo, examina-se uma pequena parte chamada 
amostra. 

Uma população pode ser finita ou infinita. Por exemplo, a 
população constituída por todos os parafusos produzidos numa fá- 
brica em certo dia é finita, enquanto que a população constituida 
de todos os resultados (cara ou coroa) em sucessivos lances de uma 
moeda é infinita. 


ESTATÍSTICA 


Se uma amostra é representativa de uma população, conelusões 
importantes sôbre a população podem ser inferidas de sua análise. 
A parte da estatística que trata das condições sob as quais essas 
inferências são válidas chama-se estatística indutiva ou inferência 
estatistica. Como essa inferência não pode ser absolutamente certa, 
a linguagem da probabilidade é muitas vêzes usada, no estabeleci- 
mento das conclusões. 


A parte da estatística, que procura sômente descrever e analisar 
um certo grupo, sem tirar quaisquer conclusões ou inferências sôbre 
um grupo maior, é chamada descritiva ou estatística dedutiva. 

Antes de prosseguir no estudo da estatística, recordaremos alguns 
conceitos matemáticos importantes. 


Variáveis contínuas e discretas 


Uma variável é um símbolo, como X, Y, H, x, B que pode assumir 
qualquer um de um conjunto de valores que lhe são atribuídos, 
conjunto êste chamado domínio da variável. Se a variável pode 
assumir apenas um valor, é denominada constante. 


Uma variável que pode assumir teoricamente qualquer valor 
entre dois dados, chama-se variável continua; de outro modo deno- 
mina-se variável discreta. 


Exemplo 1. O número N de crianças, em uma família, que pode assumir 
qualquer um dos valores 0, 1, 2, 3, ... mas não pode ser 2,5 ou 3,842, é 
uma “variável discreta. 


Exemplo 2. A altura H de um indivíduo que pode ser 1,65 metro,: 1,662 
metro ou 156722 metro, conforme a precisão da medida, é uma variável 
continua. 


Os dados que podem.ser descritos por meio de uma variável 
discreta ou contínua, são chamados dados discretos ou contínuos, 
respectivamente. O número de crianças em cada uma de 1000 
famílias, é um exemplo de dados discretos, enquanto que o pêso 
de 100 estudantes universitários é um exemplo de dados contínuos. 
Em geral, as medições dão origem a dados contínuos, enquanto que 
as enumerações ou contagens resultam em dados discretos. 


luitas vêzes, é conveniente estender o conceito de variável a 
entidades não-numéricas. Por exemplo, a côr C de um arco-íris é 
“uma variável que pode tomar os “valores” vermelho, laranja, amarelo, 


$ 
i 
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verde, azul, anil e violeta. Geralmente, é possível substituir essas 
variáveis por quantidades numéricas. Por exemplo, atrbui-se 1 ao. 
vermelho, 2 ao laranja, cte. 


Arredondamento de dados 


O resultado do arredondamento de um número como 72,8 para 
o inteiro mais próximo é 73, pôsto que 72,8 é mais próximo de 73 do 
que de 72. Semelhantemente, 72,8146 arredondado para o centé- 
simo mais próximo, ou com duas decimais, é 72,81, porque 72,8146 
é mais próximo de 72,81 do que de 7282. 


Ao arredondar 72,465 para o centésimo mais próximo, entretanto, 
deparamo-nos com um dilema, pois 72,465 dista igualmente de 72,40 
e de 72,47. Usa-se, na prática, em tais casos, aproximar para o 
número par que precede o 5. Assim, 72,165 é arredondido para 
72,46, 183,575 é arredondado para 183,58 e 116 500 000, arredon- 
dado para as unidades de milhões mais próximas, é 416000000. 
Esta prática, é especialmente valiosa para reduzir ao mínimo os erros 
acumulados por arredondamento, quando tratar-se de grande número 
de operações (veja o Probl. 4). 


Notação científica 


Ao escrever números, especialmente aquêles que comporten 


muitos zeros, antes ou depois da vírgula, é conveniente empregar a 
notação científica que utiliza as potências de 10. 


Exemplo 1. 10! = 10; 10! = 10X 10 = 100; 108 = 10X10 X 10 X 
X 10X 10 = 100 000; 108 = 100 000 000. 


Exemplo 2. 10º = 1; 10! = 0,1; 102 = 0,04; 1078 = 0,00001. 
Exemplo 3. 864000 000 = 8,64 X 10%; 0,0000346 = 3,416 X 107%. 


Note-se que, multiplicando-se um número por 10º, por exemplo, 
tem-se o mesmo resultado que ao deslocar a vírgula, para a direita, 
de 8 casas. Multiplicando-se o número por 10% tem-se o mesmo 
resultado que no deslocar a vírgula, para a esquerda, de G casas. 

Muitas vêzes empregam-se parênteses ou pontos para indicar 
a multiplicação de dois ou mais números. Assim: (5)(3) Bs 
=5X3= 15 (0X00) = 10:10-10 = 10 X 10X 10 = 1000. 
Quando se empregam letras para representar os números, os parên- 
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teses ou os pontos são, muitas vêzes, omitidos. Por exemplo ab = 
= (0d) = a:b =a X b. l 
A notação científica é muitas vêzes útil no cálculo, especialmente 
para localizar a vírgula, Usam-se as seguintes regras: 
(107) (109) = 108: 102 = 1092 
i ’ 1% 7 
em que p e q são números quaisquer. 
Em 10º, p é denominado o expoente e 10 a base. 


Exemplo 1. (10/10!) = 1000 X 100 = 100 000 = 105 (i.e. 10%) 


308 1000 000 
107 10000 


Exemplo 2. (4 000 000)(0,0000000002) = (+ X 10°)(2 Xx 10710) = 
= (4) (2)GVEXL0T) = 8 X 106710 = 8 X 107! = 0,0008, 


(0,006X80 000) (6X 10X8 X 10) 48 X10 
0,04 4X 10° 4 X 10° 


(E) x 102 = 12 X 10º = 12000. 


= 100 = 102 (i.c. 10%). 


Exemplo 3. 


i 


Algarismos significativos 


Se uma altura foi determinada com precisão como 1,66 metro, 
isto significa que seu valor verdadeiro está compreendido entre 1,655 


e 1,065 metro. Os algarismos corretos, separados dos zeros neces ios 
para a localização da vírgula, chamam-se algarismos significativos 


ou digitos significativos do número. 


Exemplo l. 1,06 tem 3 algarismos significativos. 

Exémplo 2. 4,5300 tem 5 algarismos significativos. 

Exemplo 3. 0,0018 = 1,8 X 107º tem 2 algarismos significativos, 
Exemplo 4. 0,001800 = 1,800 X 107º tom + algarismos significativos. 


Os números resultantes de enumerações ou de contagens, ao 
contrário dos das medições, são naturalmente exatos e, assim, têm 


“uma quantidade ilimitada de algarismos significativos. Em alguns 


dêstes casos, contudo, pode ser difícil decidir quais são os algarismos 
significativos sem informações adicionais Por exemplo, o número 
186 000 000 pode ter 3, 4, ..., 9 algarismos significativos. Se se 
souber que êle tem 5 algarismos significativos, será melhor escrever 
o número como 186,00 milhões ou 1,8600 X 108. 


aa 
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Cálculos 


Ao efetuar cálculos que envolvem multiplicação, divisão e ex- 
tração de raízes de números, o resultado final não pode ter mais 
algarismos significativos do que o que tem menor quantidade déles 
(veja o Probl. 9). 


Exemplos: 1. 73,24 X 4,52 = (7324452) = 831 2. 1,648/0,023 = 72 
3. 4387 =622 4. (8,416X(50) = 420,8, se 50 é exato. 


Ao efetuar adições e subtrações de números, o resultado final 
não pode ter mais algarismos significativos depois da vírgula do que 
o que tiver menor quantidade dêles nessa condição (veja o Probl. 10). 


Exemplos: 1. 3,16 +2,7 =59 2. 83,42 — 72 = 11 3, 47,816 — 25 = 
= 22,816 se 25 fôr exato. : 


A regra acima para adição e subtração pode ser ampliada (veja 
o Probl. 11). i 


Funções 


Se a cada valor que a variável X pode assumir corresponder 
um ou mais valores da variável Y, diz-se que Y é uma função de X 


é estrevo-se Y=" F(X) (ler “Y igual à função-F-de-X)-para-indicar---- =... 


essa dependência funcional. Outras letras, tais como G, &, ete., 
podem ser usadas em vez de F. ' 


A variável X chama-se variável independente, e Y chama-se a 
variável dependente. 


Se apenas um valor de Y corresponde a cada um de X, diz-se 
que Y é uma função unívoca de X; de outro modo, ela seria denomi- 
nada uma função plurwoca de X. 


Exemplo 1. A população total P dos Estados Unidos é uma função do 
tempo t e escreve-se P = F(t). 


Exemplo 2. A tensão S de uma mola vertical é uma função do pêso W 
colocado em sus extremidade. Em símbolos, S = G(W), 


A dependência funcional ou correspondência entre duas variáveis 
é, muitas vêzes, representada em um quadro. Entretanto, ela 
também pode ser representada por uma equação que correlaciona 
as variáveis, como Y = 2X —.3, da qual Y pode ser determinado, 
em correspondência com os vários valores de X. 
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Se Y = F(X), é hábito fazer com que F(3) signifique “o valor 
de Y quando X = 3”; P(10) significa “o valor de Y quando X = 10”, 
ete. Assim, se Y = F(X) = Xº, então F(3)=3?=9é60 valor de 
Y quando X = 3. 

O conceito de função pode ser estendido a duas ou mais variáveis 
(veja o Probl. 17). 


Coordenadas retangulares 


Consideremos duas retas perpendiculares, X'0X e Y'OY, de- 


nominados eixos dos X e dos Y, respectivamente (veja Fig. 1-1), 
sôbre os quais sãọ indicadas escalas apropriadas. Essas retas dividem 
o plano por elas determinado, denominado plano dos XY, em quatro 
regiões representadas por 1, II, Il e IV e denominadas primeiro, 
segundo, terceiro e quarto quadrantes, respectivamente. 


Y O ponto O chama-se origem ou 
n 1 


Rensa pe 
ro 


baixam-se por êle perpendiculares 
aos eixos dos X e dos Y. Os va- 
lores de X e Y nos pontos em que 
as perpendiculares encontram os 
eixos, são denominados coordena- 
das retangulores ou, simplesmente, 
coordenadas de P e são represen- 
tados por (X, Y). A coordenada 
X chama-se abscissa do ponto e 
Y é sua ordenada.. Na Fig. 1-1, 
a abscissa do ponto P é 2, a ordenada é 3 e as coordenadas 
de P são (2,8). 

Reciprocamente, dadas. as coordenadas de um ponto, podemos 
tocalizá-lo ou locá-lo. Assim, os pontos de coordenadas (—4, —3); 
(-23, 45) e (85, —4) são representados na. figura acima, por 
Q, Re 8, respectivamente. 


Mediante a constituição de um eixo Z, que passa por De & per- 
pendicular ao plano XY, pode-se ficilmente estender as idéias acima. 
Em tais casos, as coordenadas do ponto P seriam representadas por 
(X, 7,0. ` 


ponio zero. Dado um ponto Pi 


A 
E! 


MESTRES. Bs 


OISETA 


E ra 


! 
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Gráficos 


Um grájico é uma representação gráfica da relação entre variá- 
veis. Muitos tipos de gráficos são empregados na estatística, de= 
pendendo da natureza dos dados pertinentes e da finalidade para 
a qual êle é destinado. Entre êstes, estão os gráficos de barras de 
setores ilustrativos (pictograma), etc. Essas representações gráficas 
chamam-se gráficos ou diagramas. Assim, falamos de gráficos de 
barra, diagramas de setores ete. (veja os Probls. 23, 24, 26 e 27). 


Equações 


Equações são relações da forma 4 = B, onde A é chamado o 
primeiro membro da equação e B o segundo membro. Sempre que se 
efetuam as mesmas operações em ambos os membros de uma equação, 
obtêm-se equações equivalentes. Assim, podem-se adicionar, subtrair, 
multiplicar e dividir ambos-os membros de uma equação pelo mesmo 
valor é obter uma equivalente, com a única exceção da divisão por 
zero, que não é permitida. ` 


Exemplo: Dada a equação 2X -+3 = 9. 
Subtraindo 3 a ambos os membros: 
2X +3-3=9-3 ou 2X = 6, 
Dividindo ambos os membros por 2: 
2X/2 = 6/2 qu X=3, 


fiste valor de X é a solução da equação dada, pois vê-se que, substituindo-se X 


por 3, obtém-se 2(3) + 3 = 9 ou 9=9,0 que é uma identidade. O processo - 


para se obter as soluções de uma equação é denominado resolução da equação. 


Os princípios acima podem ser estendidos para encontrar as 
soluções de duas equações a duas incôgnitas, três equações a três 
incógnitas, ete. Essas equações chamam-se equações simultâneas (veja 
o Probl. 30). 


Desigualdades 


Os símbolos < e > significam “menor do que” e “maior do que”, 
respectivamente. Os símbolos S e = significam “menor do que 
ou igual” e “maior do que ou igual”, respectivamente. São conhe- 
cilos como símbolos de desigualdades. 
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Exemplo 1. 3<5 leia-se “3 é menor do que 5”. 

Exemplo 2. 5>3 leia-se “5 é maior do que 3”. 

Exemplo 3. X <8 leia-se “X é menor do que 8”. 

Exemplo 4 X = 10 leia-se “X é maior do que ou igual a 10”, 

Exemplo 5. 4< Y g6 leia-se “4 é menor do que Y, o qual é menor 
do que ou igual a 6”, ou “Y está compreendido entre 4 e 6, com exclusão de 
4, mas incluindo 6”, ou “Y é maior do que 4 e menor do que ou igual a 6”, 


As relações que envolvem símbolos de desigualdade são deno- 
minadas desigualdades. Assim como nos referimos aos membros de 
uma equação, pode-se também falar em membros de uma desigualdade. 
Assim, na desigualdade 4 < Y S 6, 4, Y e 6 são os membros. 


Uma desigualdade permanece válida quando: 


(a) - o mesmo número é adicionado a ou subtraído de cada 
um de seus membros. 


* Exemplos: Como 15>12; 15 +3>12+3 (ie. 18>15) e 15-3> 
> 12 — 3 (i.e., 12 > 9); 


(b) cada membro é multiplicado ou dividido pelo mesmo 
número positivo. 


Exemplos: Como 15> 12; (15X(3) > (123) (i.e., 45 >36) e = > 2 


3 
“e, 5> 4j = o ao 


tc) cada membro é multiplicado ou dividido pelo mesmo 
número negativo, desde que se proceda à inversão do símbolo de 
desigualdade. 


Exemplos: Como 15> 12; (15(- 3) < (12X — 3) (Le, — 45 < — 36) e 
AL e,-< 4, 
3 (ie ) 


Logaritmos 


Cada número positivo N pode ser expresso como uma potência 
de 10, i.e., pode-se sempre determinar p de modo a que N = 10?, 
p é denominado logaritmo de N na base 10 ou logaritmo decimal de N, 
e escreve-se abreviadamente p = log N ou p = logi N. Por exemplo, 
visto que 1 000 = 103, log 1 000 = 3. Semelhantemente, 0,01 = 1072, 
log 0,01 = — 2. Quando N é um número compreendido entre 1 e 
10, i.e., 10º e 107, p = log N tem um valor compreendido entre O e 1 
e pode ser encontrado nas tábuas de logaritmos do Apêndice. 


i 
H 
i 
f 


> 


maniissa. À parte remanescente, antes da vírgula. da mantissa, 
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Exemplo 3. Pare determinar log 2,36, procura-se na coluna à esquerda, 
encabeçada por N, até encontrar os dois primeiros algarismos 23. Então, des- 
loca-se para a direita, até a coluna encabeçada por 6, Encontrá-se o valor 
3729. Assim, log 2,36 = 0,3729, i.e., 2,36 = 1093729, 


Os logaritmos de todos os números positivos podem ser deter- 
minados a partir dos logaritmos dos números compreendidos entre 
i e10. 


Exemplo 2. No exemplo 1; 2,36 = 10%3729, Multiplicando-se sucessiva- 


À mente por 10: 


28,6 = 10179, 236 = 108739; 2360 = 103809, ,., 
Portanto, log 2,36 = 0,3729; log 23,6 = 1,3729; log 236 = 2,8729; log 2360 
= 3,3729. 


Exemplo 3. Pósto que 2,36 = 108829, encontram-se, por meio de divi- 
sões sucessivas por 10: 


0,236 = 100729-1 + 10-06; 0,0236 = 1008729 xs aonne, 


Muitas vêzes escreve-se 0,3729 — 1 como 9,3729 — 10 ou 1,8729, e 0,3729 — 2 
como 8,3729 — 10 ou 2,3729, etc. Com essa notação, teremos: 


log 0,236 = 9,3729 — 10 = 1,3729 = — 0,6271 
log 0,0236 = 8,3729 — 10 = 2,3729 = — 1,6271, ete. 


A parte decimal O 13729, de todos êsses logaritmos, é deno: 


ie, 1, 2, 3, e 1, 2 ou 9— 10, 8—10; é denominada. caraciertstica. 
As seguintes regras são facilmente demonstradas: 


(1) Para um número maior do que 1, a característico é positiva 
e é igual ao número de algarismos antes da vírgula menos um. 
Assim, as características do logaritmo de 2 360, 286, 23,6 e 2,96 


são 3, E fa e 9 e seus logaritmos são, respectivamente, 3,3729, 
2,3729, 1,3729 o 0,3729. 


(2) Para um número menor do que 1, a caracteristica é negativa 
e é igual ao número de zeros que estão imediatamente apósa virgula 
mais UM. 


Assim, as características dos logaritmos de 0,236, 0,0236 e 0,00236 
são —1, — 2 e —3 e seus logaritmos são 1,3729, 2,3729 e 5,3729 
ou 9,3729— 10, 8,8720910 e 7,3729--10, respectivamente. 

Se forem necessários os logaritmos de números de quatro algaris- 
mos, tais como 2,364 e 758,2, pode ser empregado o método de 
interpolação (veja o Probl. 36). 
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Antilogaritmos 

Sob a forma exponencial 2,36 = 1098729, o número 2,36 é cha- 
mado o antilogaritmo de 0,3729, ou antilog 0,3729. E um número 
cujo logaritmo é 0,3729. Segue-se imediatamente que: 

antilog 1,3729=23,6; antilog 2,3729 = 236; antilog 3,3729 = 2 360)... 

antilog 9,3729— 10 = antilog 1,3729 = 0,236; 

antilog 8,3729- 10 = antilog 2,3729 = 0,0236;... 

O antilog de qualquer número pode ser encontrado consultan- 
do-se as tabelas do Apêndice. 

Exemplo: Para determinar o antilog de 8,6284 — 10, procura-se a man- 
tissa. 0,6284 no corpo da tábua. Visto que ela aparece na linha correspondente a 
42 e na coluna encabeçada por 5, os algarismos do número procurado são 
425. Como a característica é 8 — 10, o número pedido é 0,0425. Semelhante- 
mente, antilog 3,6284 = 4 250, antilog 5,6284 = 425 000. 

Se a mantissa não fôr encontrada na tábua, pode-se usar in- 
terpolação (veja Probl. 37). 


Os cálculos que empregam logaritmos utilizam as seguin- 
tes propriedades: 
log MN. = log M +.log N 


bE = log M — log N 


N 
log M? = plog M 
log V M = a A 


Mediante a combinação dessas propriedades encontram-se Os 


resultados, por exemplo: 


BIC” Da 
log Ee = plog A + qlog B + r log C — slog D t log E. 


Veja Probls. 38 a 45. 
Problemas Resolvidos 


Variáveis: 
i. Estabelecer quais dos dados seguintes são discretos e quais 


são contínuos. 
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(a) Número de.ações vendidas diariamente na Bôlsa de Yalores. 

Resp.: Discreto. 

(b) Temperaturas registradas cada. meia hora em um pôsto de Meteorologia. 
Resp: Contínuas. 


(c) Vida média das válvulas de televisão produzidas por uma, determinada 
companhia. 


Resp.: Continua, 

(d) Salários anuais de professóres de colégio. 

Resp.: Discretos. 

(e) Comprimentos de 1000 parafusos produzidos numa fábrica, 

Resp.: Contínuos. 

2. Dê o domínio de cada uma das seguintes variáveis e diga 
se são contínuas ou discretas. 


(a) Número G de litros de água numa máquina de lavar roupa. 

Domínio: Qualquer valor desde zero até a capacidade da máquina. 
Variável contínua. 

(b) Número B de livros em uma estante de biblioteca. 

Domínio: 0, 1, 2, 3, ... até o número máximo de livros que pode ser 
colocado na. estante. Variável discreta, ` 

(c) Soma § de pontos obtidos ao lançar um par de dados. 

Domínio: Os pontos obtidos num dado podem ser 1, 2; 3; 4, 5 ou 6. 

Então a soma de pontos de um par de dados pode ser 2, 3, 4, 5, 6, 7, 
8, 9, 10, ll e 12, os quais são o domínio de S. Variável discreta, 

(d) Diâmetro D de uma esfera. 

Domínio: Se se considerar um ponto como uma esfera de diâmetro 
nulo, o domínio de D compreende todos os valores de zero para cima. Variável 
contínua, $ 

(e) País C na Europa. 


Domínio: Inglaterra, França, Alemanha etc. que podem ser represen- 
tados numêricamente por 1, 2, 3 ete. Variável discreta, 


Arredondamento de dados 


3. Arredonde cada um dos números seguintes conforme a 
precisão indicada. 


(a) 48,6 para a unidade mais próxima. 49 
(b) 136,5 para a unidade mais próxima 138 
(c) 2,484 para o centésimo mais próximo 2,48 
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(d) 0,0435 para o milésimo mais próximo 0,044 
(e) 4,50001 para a unidade mais próxirar . 5 
(0) 143,95 para o décimo mais p 144,0, 
(9) 368 para a centena mais próxima 400 
(h) 24448 para o milhar mais próximo 24 000 
(i) 5,56500 para o centésimo mais próximo | 5,56 
(j) 5,56501 para o centésimo mais próximo 5,57. 


4. Some os números 4,35, 8,05, 2,95, 12,45, 6,05, 7,55 e 9,75 
(a) diretamente; (b) arredondando para décimos de acôrdo ccm 
a convenção do número pár; (c) arredondando de maneira que o 


algarismo anterior a 5 cresça de uma unidade. 


Solução: 
(a) 4,35 O 44 () 44 

8,65 8,6 87 5 
2,95 30 3,0 Note-se que o processo 

12,45 12,4 12,5 (b) é melhor do que o (c), 
6,05 6,6 67 visto que aquêle método 
7,55 7,6 TO reduz ao mínimo os erros 
9,75 98 o 9,8 acumulados com arredon- 


Total 5235 - Total 524 Total 52,7 damento. 


* Notação científica e algarismos significativos 


5. Expresse cada um dos seguintes números sem usar as po- 
tências de 10. 


(a) 4,823 X 107, Desloque a vírgula 7 casas para a direita e obtenha 
48 230 000. 

(b) 8,4 X 107% Desloque a vírgula 6 casas para a esquerda e obtenha, 

0,0000084, 

0,000380. (e) 300 X 105 = 3 000 000 000. , 

86 000, Q) 70000 X 10™° = 0,0000070000. 


() 380 X 10 
(d) 1,86 X to 


6. Quantos algarismos significativos há em cada um dos seguin- 


st 


tes números, supondo-se que êles foram registrados com precisão ? 


(a) 149,8 polegadas QUATRO 1f) 9 gramas UM 
(b) 149,80 polegadas cinco (9) 9 casas ILIMITADO 
(h) 4,0 X 10º libras DOIS 


tc) 0,0028 metros pois 
ti) 0,09280 mu 3 
(e) 1,00290 mu 


€) 7,58400 X 10%% dinas sers 


` significativos, não pode ser mais 
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7. Qual o êrro máximo cometido em cada uma das seguin- 
tes medições, supondo-se que elas tenham sido feitas com precisão ? 
Dê o número de algarismos significativos om cada caso. 

(a) 73,854 polegadas. A medida poderia tomar qualquer valor desde 
73,8535 polegadas até 73,8545 polegadas e, então, o êrro máximo é de 0,0905 
polegadas. Cinco algarismos significativos estão presentes. 


(b) 0,09800 pés cúbicos. O número de pés cúbicos pode estar situado 
desde 0,097995 até 0,098005 e, então, o êrro máximo é de 0,000005 pés cúbicos. 
Quatro algarismos significativos estão presentes. 


(c) 3,867 X 108 milhas. O número real de milhas é superior a 3,8665 X 108 
mas é inferior a 3,8675 X 108; por isso o ĉrro máximo É de 0,0005 X 108 ou 80 000 
milhas. Quatro algarismos significativos estão presentes. 

8. Escreva cada número empregando a notação cientifica. 
Considere todos os algarismos significativos a menos que haja in- 
dicação em contrário. ` 

(a) 24380000 (quatro algarismos significativos) = 2,438 X 107 

(b) 0,000009851 = 9,851 x 108 

tc) 7300000 000 (cinco algarismos significativos) = 7,3000 X 10º 

(d) 0,00018400 = 1,8400 X 10". 


Cálculos 


9. Demonstre que o produto do número 5,74 por 3,8, adinitin- 
do-se que êles tenham, respectivamente, três e dois algarismos , 
preciso do que com dois algarismos 


significativos. 

Primeiro método: 

5,74 X 3,8 = 21,812, mas nem todos os algarismos dêsse produto sio sig- 
nificativos. Para determinar quantos o são, observe-se que 5,74 é o arredonda- 
mento de qualquer número compreendido entre 5,735 e 5,745, enquanto que 
3,8 o é para o intervalo entre 3.75 e 3,85. Portanto, o menor valor possível do 
produto é 5,735 X 3,75 = 21,50625 e o maior 5,745 X 3,85 = 22,11825. 

Visto que a faixa de valores vai de 21,50025 a 22,11825, é evidente que 
sômente os doi primeiros algarismos do produto podem ser significativos, sendo 
22 o resultado. Note-se que 22 é o arredondamento de qualquer número com- 
preendido entre 21,5 e 22,5. 

Segundo método: 


Grifando em itálico os algarismos que podem ser duvidosos, o produto 
pode ser calculado da maneira seguinte: 


5,74 

38 Não conservando mais do que um algarismo duvidoso 
4592 na solução, esta será, em consequência, 22, com dois 
1722 algarismos significativos, 


21,812 
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Note-se que é desnecessário manter um número de algarismos significativos 
maior do que o que existe no fator preciso. 5,74 será, então, arredondado para 
5,7 e o produto será 5,7 X 3,8 = 21,66 = 22, com dois algarismos significativos, 
o que concorda: com os resultados anteriores. 

Ao calcular sem o auxílio de máquina, o trabalho pode ser diminuído 
quando não se conserva mais do que um ou dois algarismos além dos do fator 
menos preciso ẹ se arredonda para o número adequado de algarismos significati- 
vos da solução final. 


10. Some os números 4,19355, 15,28, 5,9561, 12,3 e 8,472, 
considerando significativos todos os algarismos. 
- Solução: 


Em (a), os algarismos duvidosos da adição estão em tipos itálicos. A 
resposta final, apenas com um algarismo duvidoso, é tomada como sendo 46,2. 


(a) 4,19355 (b) 419 Pode ser economizado algum trabalho 


15,28 15,28 procedêndo-se como em (b), onde se con- 

5,9562 5,96 serva apenas mais uma casa decimal 
12,8 12,3 além das do número de menor precisão. 
8.472 847 A resposta. final, aproximada para 46,2 
40,20165 46,20, concorda com (a). 


11. Calcule 475 000000 -+ 12 684000 — 1372410, se: êstes 
números: têm 3, 5 e 7 algarismos significativos, respectivamente. 


Solução: 

No cálculo (a), todos os algarismos são conservados e & resposta. final é ar- 
redondada. Em (b), emprega-se um método semelhante ao do Probl. 10 (b). Em 
ambos os casos, os algarismos duvidosos estão em tipo itálico, ` 

(a) 476 000 000 487 684 000 (b) 475 000 000 487 700 000 

-+ 12 684 000 — 1 372 410 + 12700000 — 1 400 000 
487 684 000 486 311 590 487 700 000 486 300 000. 


O resultado final é aproximado para 486 000 000 ou, melhor ainda, para 
mostrar que são 3 os algarismos significativos, escreve-se 486 milhões ou 4,86 X 108, 


12. Efetue cada uma das operações indicadas. 


(a) 48,0 X 943 = (48,0)(943) = 45 300 (b) -8,35/08 = 0,085 
(e) (8X4 193182) = (2,8 X 10)X4,193 X 101,82 X 10°) = (2,8X4,193) 
(1,82) X 1013+ = 21 X 108 = 2,1 X 10º. 


Isso também pode ser escrito como 21 milhões, para indicar os dois sl- 
garismos significativos. 
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(526,7)0,001280) _ (5,267 X 10°)(1,280 X 107) (5207/1280) x 
0,000034923 3,4921 X 10% AQ 


el 
= 1,981 xs = 1,981 X 1075 = 1,931 X 104, 


(d) - 


LOUS (ga x AO 
xos PEA 


Isso também pode ser escrito como 19,31 mil, para indicar os quatro alga- 
rismos significativos. 
(e) (1,47562 — 1,47822)(4895,30) (0,00240)(4895,36) 
0,000159180 0,000159180 
= (2,40 X 1079X4,89536 X 108)  (2,40)(4,80536) y aouo, = 
e 


a WO o 
= 7,38 X ger = 738X 10, 


Isso também pode ser escrito como 73,8 mil para indicar os três algarismos 
significativos. 


Note-se que, embora todos os números contivessem inicialmente seis algaris- 
mos significativos, alguns dêles foram perdidos ao subtrair-se 1,47322 de 1,47562. 


38 2 
(f) Se os denominadores 5e 6 são exatos, Sá + BL = 3,84 + 


+ 5,009 = 8,85. 
(9) 3,1416 471,35 = (2,1416)(8,447) = 26,54 
(h) v 128,5 — 89,24 = 430,3 = 6,27, 


13. Calcule o valor numérico das seguintes equações, para 
X=3,Y=—5 4=4, B=-— 7, sendo todos os números: su- 
postos exatos. 

(a) 2X -3Y=U9) ~ 3(— 5) = 6 +15 = 2i 

(0) 4Y — 8X +28 = 4(— 5) ~ BB) +28 = — 20 — 24 -+ 28 = — 16 

O SELBL (GDA = 12435 24 a 47 

BX — AY (— 7X8) — (4X 5) 221 +20 —1 
(d) X? — 3XY — 27º = (8º — 36 5) — A~ 5 = 0445 —50 = 4 
(e) AX ASP) — ABX ~ 2Y) = 2168) + 3t- 5] — 488) — 2 5) = 


= 913 — 15] — 4(9 + 10] = 2(— 12) — 4(19) = — 24 — 76 = — 100 
Outro método: 
AX +3Y) — 48X — 2Y) = 2X +6Y — 12X +8Y =.= 10X + 
4Y = — 103) + 14(— 5) = — 30 — 70 = — 100 
p xL-r BE-(5P n 22% 
ABA GP- +l 16-49 +1 
= aB: ALAAN 0,5 
=32 2 


@ VIY gA F aB SS = VIBY — (5P 307 + 
= IB — 25 — 48 F 196 +3 = 144 = 12 
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5A? 2B O Ca L e 8 an 
o qi 1% 4 3 t Ega fogo VIA = 3,2, 


aprox. 


Funções 


14. A Tabela 1.1 mostra o número de bushels de trigo e de 
milho produzido na fazenda PQR durante os anos de 1950 a 1960. 

Com referência a esta tabela, determine o ano, ou anos, durante 
os quais: 


Tabela 1.1 
T 
Número de bushels Número de bushels 
A trigo milho 
mos (arredondado a (arrédondado a 
menos de 5 bushels) menos de 5 bushels) 
j $ 
- 1950 200 K 
1954 185 0. 
1952 225 100 
1953 250 85 
1954 : 240 so 
1955 195 109 
1956 230 110 
1957.. T E EEEE L. 
1958 250 95 
1959 ' 230 110 
1960 * 235 100 
4 


(a) foi produzido o menor número de bushels dê trigo; 
(6) foi produzido o maior número de bushels de milho; 
(c) ocorreu o maior declínio na produção de trigo; 


(d) a produção de milho decresceu enquanto que 2 produção de trigo cresceu 
om relação 20 ano ; 


(e) foi produzido o mesmo número de bushels de trigo; 


() a produção tot foi m 
Resp: (a) 1951; (9) 


(e) 1952, 1957, 1953, 1958; (7) 1958. 


al de trigo e 


f: 


15. ádmita-se que W 
número Je bushels de tri 


e 1359; (c) 1855; (d) 1953, 1957, 1958, 1960; 


ananena sen eene 
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(a) Determinar W quando t = 1956 Resp: 210 
(db) Determinar C quando £ = 1953 e Resp.: 85 e 110, respectiva- 
1959 mente 
(6) Determinar t quando W = 225 Resp.: 1952 e 1957 
(d) Determinar F (1954) Resp: 240 
(e) Determinar G (1958) Resp: 95 
Q) Determinar C quando W = 210, Resp.: 110 
(g) Qual é o ‘domínio da variável £? Resp.: Os anos 1950, 1951 
-a 1960. 


(h) W é uma função unívoca de t? 


Sim, porque para a cada valor que t pode assumir (ie. no domínio de 1) 
corresponde um único valor de W. 
(i) Ot é uma funçãode W? Se fòr, é uma função unívoca? 


Sim, t é uma função de W porque, a cada valor que W pode assumir, cor- 
responde um ou msia valores do à, que'podem ger encontrados na tabela. 


Como pode haver mais de um valor de | correspondente a um de W (por 
exemplo, quando W = 225, t = 1952 ou 1057), a função é plurívoca. Esta 
dependência iuncional de ? em releção a W pode ser escrita t= FW), 


(G) O é uma função de F? 


Sim, porque a cada valor que W pode assumir, corresponde um ou mais 


valores de C, como se determina d na Tabela L L Semelhantemente, w é uma 


função de-0; 
(k) Qual das variáveis é independente, t ou W? 


Fisicamente, é costume imaginer W como sendo determinada em função 
de t em vez de £ em função de W. Diste módo, fisicamente, t é uma variável 
independente e W a dependente. 


Mestemáticamente, entretento, qualquer varigvel pode ser considerado 
independente e a outra dependente. Aquela à qual se atribuem vários valores 
é a independente, A outra, que é então determinada como resultado, é a de- 
pendente. 


16. A variável Y depende da variável X através da relação, 
Y=2X-3 (onde 2 e 3 são exatos). 

tc) Determinar Y, quando X 

Quando E = 3, Y 

Quando « = (= BD)-Zm 4 Bm? 


É correspondentes dz 


“belas. A relação Y = 2X — 3 é 
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Os valores de Y, calculados como está indicado em (a), estão apresen- 
tados na tabela. Note-se que, 
usando outros valores de X, po- Xi -2 -=l 0 i 2.8.4 
dem ser construídas várias ta- Yj-7 -5 —3 —i 1 3º 5 


equivalente à coleção de tôdes as tabelas possíveis. 
(c) Se a relação entre Y e X é representada por Y = FE), determine 
PR) e F(0,8). 


FO = X24) — 3 = 4,8—3 = 1,8; P0,8)=208)-3=16 — 
-3 =- 14 


(d) Qual o valor de X que corresponde a Y = 15? 


Substituindo Y = 15 em Y =2X —3. Teremos 15 = 2X — 
“30. 2X = 18, X= 9. 


(e) Pode-se exprimir X como uma função de Y? 


Sim. Pôsto que Y =2X -3 .. Y+3=2X 0. X=}(Y +3). Isso 
exprime X explicitamente como uma função de Y. 


Q) Y é uma função unívoca de X? 


Sim, visto que 3 cada valor que X pode assumir (e existe uma infinida- 
de dêles) corresponde um único valor de Y. 


(9) X é uma, função univoca de Y? 


Sim, porque, conforme a parte (e), X =$} (Y +3), de modo que, em cor- 
A a cada valor de Y, há sbmente um valor de X. 


17. Se z = 16 + 4X — 3Y, determinar o valor de z correspon- 
dente a: 
(a) X=2, Y=5; ©) X=-3, P=—7; (0) X=-4, Y=2. 


Solução: 


(a) Z= 16 +42) — 3(5) = 16 + 8 — 15 = 9; 
0) Z = 16 +4 3) — 3(— 7) = 16 ~ 12 +21 = 25; 
e) Z =16 +4(— 4) — 3(2) = 16 — 16 — 6 = — ô. 


A valores dados de X e Y corresponde um valor de Z. Pode-se simboli- 
zar esta dependência de Z- sôbre X e Y, escrevendo Z = F(X, Y); leia-se “Z é 
ums função de X e Y”. P(2, 5) significa o valor de Z quando X = 2 e Y = 5, 
que é 9 conforme o item (a). Semelhantemente, F(— 3, —7)=2 e 
P(—- 4, 2) = — 6, conforme os itens (b) e (c), respectivamente. 

As variáveis X e Y são chamadas independentes e Z é a dependente. 


Gráficos . 
18. Localizar sôbre o eixo dos X de um sistema de coordena- 


das, os pontos correspondentes a (a) X=4; (b) X=-—3; (0) X=25; 
(d) X = — 4,3; e (e) X = 0,4, admitidos êsses valores como exatos. 


eim ei 
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Solução: 
a 
F c q Ea 
1 1 S o o 
u u a u R 
» x x » » 

cera eee mes eee e ras pdoe quere pr A 
~$ -4 -3 -2 =I o 1 2 8 4 5 


Cada valor exato de X corresponde a um e sômente um ponto sôbre o 
eixo. Recìprocamente, demonstra-se na matemática superior que & cada ponto 
sôbre o eixo corresponde um e sòmente um valor de X. 

Assim, tedricamente, existe um ponto correspondente a X = 22/7 = 
= 3,142857142857 .., ou X = m = 3,14159265958... Naturalmente, na prática, 
nunca se pode esperar a localização exata de um ponto, porque a marca feita 
pelo lápis tem uma certa espessura 'e cobre um número infinito de pontos. 
O próprio eixo dos X tem uma certa espessura. Assim, o diagrama acima é uma 
representação física da situação matemática real. 


19. Seja X o.diâmetro de um rolamento de esferas, em po- 
legadas. Se X = 4,58, com três algarismos significativos, como isso 
séria, representado sôbre o eixo dos X? 


Solução: 
A medida indicada, 4,58 po- 
legadas, mostra que a verdadeira, 


está compreendida entre 4575 e DAS mena Orago A O E o 
4,585 polegadas. Assim, a medida 4 4,550 4,50 4,57 4,58 4,59 
seria representada pelo segmento 

indicado em traço grosso. 


20. Localizar, núm sistema de coordenadas retangulares, os 
pontos que têm as seguintes coordenadas: 


@ 67, DB, (O 31, (DI — 3, (0) GB; — 4), 
Q) (= 25; — 4,8), (g) (0; — 2,5), (A) (4,0). 


Admitir que todos os números dados 


são exatos. Veja a solução na Fig. 1-2, 2 âros 2,6) 
ao lado. ss (1-8) 
m @(3; 4) 


t2540 og 
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21. Representar gráficamente a equação Y=2X-—3. 


Solução: 


Fazendo X = — 2, —1,0,1, 

2, 3 e 4, têm-se Y = —7, —5, —3, 

—1, 1, 3 e 5, respectivamente 

[veja Probl. 16). Os pontos do 

gráfico são dados por (— 2; — 7), 

z (= 1; = 5),(0; — 3), (1; — 1), (2; 1), 
r (3; 3) e (4; 5), os quais são locados 
em um sistema de coordenadas 
retangulares, como o apresentado 

na Fig, 1-3. Todos êsses pontos, 


E a bem como os obtidos pela atribui- 

des ção de outros valores a X, situam-se 

> Fig. 1-3 sôbre uma linha reta, que é o gráfico 
desejado. 


Como o gráfico de Y = 2X — 3 é uma linha reta, F(X) = 2X — 3 é ge- 
ralmente denominar uma junção linear, Em geral, F(X) = aX + b, em que a eb 
são constantes, é uma função linear cujo grático é uma linha reta. 

Note-se que apenas dois pontos são realmente necessários para represen- 
tar uma função linear, visto que êles determinam uma reta. 


22. Representar graficamente a equação Y = X? — 2X — 8. 


Solução: 


Os valores de Y, correspondentes 

a vários valores de X, estão indicados 

na tabela abaixo. Por exemplo, quando 

= 2, Y =(= 2 — 2 (— 2) -8 = 
=4 44-80, 


Aj 3 2—1 0 1 2 345 


r] TO -5-8-8 —-8 -50T 


Nessa tabela, os" pontos do grg- 
fico são dados por (~ 3;:7), (— 2; 0), 
(= 1; — 5), (0; — 8) (1; —9), (2; — 8), 
(3; — 5), (4: 0), (5; 7). Vê-se que êsses 
pontos, bera como outros obtidos pela 
utilização de valores diferentes de X, 
recaem sôbre a curva apresentada na Fig. 1-4 
Fig. 1.4. 


A relação F(X) = X? — 2X — 8 é denominada 
X. 


A curva chama-se parábola. 
junção do 2º grau (ou quadrá 


cap. 1 VARIÁVEIS E GRÁFICOS ai 


De maneira geral, o gráfico da equação Y =a + DX + cX’, em que a, be 


„ e são constantes e c = 0, é uma parábola. Sec = 0,0 grafico é ums linha reta 


como no Probl. 21, 


23. A Tabela 1.2 dá a população dos Estados Unidos (em mi- 
lhões) para os anos 1840, 1850 ..., 1960. “Representar graficamente 
êsses dados. 


Tabela 1.2 População (om milhões) dos Estados Unidos, 1840-1960 


1840 1850 1360 1870 1880 1860 1900 3910 1920 1930 1940 1959 1960 


17,1 23,2 314 30,8 50,2 629 76,0 92,0 1057 122,8 131,7 151,1 179,3 


: 
(Fonte: Serviço de Recenseamento) 

Primeiro métódo: 

Referimo-nos à Fig. 1-5. Nesse = 100 


gráfico a População, representada por Eme 
P, é & variável dependente e o tempo, Ë 


representado por i, é a independente: wod- 
Os pontos são localizados do modo 3% 
usual, por meio das coordenadas lidas $ 5 
na tabele, por exemplo (1880; 50,2). o” 
Os pontos sucessivos são ligados por "En 
meio de linhas retas, pôsto que ne- $ é 


shuma informação é dada sôbre e po- 
pulação durante os anos intermediá- 5 
rios. Por esta razão, ĉsse gráfico 6 de- (Fonte: ER vê Recenseamento) 
nominado gráfico de linha. Tig, deb 


Repare-se que as unidades, nos dois eixos, não são iguais, como o eram nã 
representação gráfica de Y = 2X — 3. Isto é perfeitamente justificado, pôsto 
que as duas variáveis. representam quantidades essencialmente diferentes. 


Note-se, também, que o zero foi indicado no eixo vertical, mes (por razões 
óbvias) não sôbre o horizontal. De maneira geral, o zero deveria ser indicado, 
sempre que fôr possível, especialmente no eixo vertical Se fôr impossível, por 
slguma vazão, indicar o zero e, se essa omissão puder conduzir o leitor con- 
“clusões errôneas, é prudente então chamar a atenção pars a omissão, por algum 
meio como o indicado no Probl. 26. 


Uma tabela, ou gráfico, que mostre a distribuição de uma, variável em função 
do tempo é denominada série temporal. 


(rallhões) 


População dos E.U.A. 
8 


1840 1850 1800 1870 1880 1890 1900 1910 1920 1930 1940 1950 1930 
Ano 


Fig. 1-6 
(Fonte: Serviço de Recenseamento) 


A Fig. 1-6 é denominada gráfico, carta ou diagrama de bárras. As larguras 


das barras, que são tôdas iguais, não têm nenhuma significação neste caso e, pode 
ser adotada qualquer dimensão conveniente, desde que não se superponham. 

O número no tôpo de cada barra pode ou não ser omitido. Se forem con- 
servados, a escala vertical à esquerda é desnecessária e pode ser omitida. 


Terceiro método: “ 


v 
POPULAÇÃO DOS EST. UNIDOS š 
DURANTE OS ANOS DE 1840 A 1960 2 E 
Cade, símbolo representa 10 000 000 habi- E e es, 
Ei o 
tentes g 8 É £ 
(Fonte: Serviço de Recenseamento) w É a o, 
s E i e 
Fig. 1-7 '2 E x DO E 
vo F o S „— WE 
o 2 E So A eg w 
s F E H ç —— EE sm 
£ Š EO o E 
2 2 E Q Ū ge gE ST 
2 2 Ẹ à um E SE EE EE 
a 8 g R S a E OBE SE BE SE 
. 8 2 É É q Esse 
Sé Fo E 3 8 e SE ses se seem 
E E o BE TESE E SE a 
E a > g 2 SE am SE EE SE SE SE EE 
“n g º EZ BE pE SE BE SE SE GE HE 
Rs o MEME E SEU MEG NSZ SEE ME ME EE ES 
TO cam MEL MEET GEL MEG BED NERI SEEC EE MEO DEE EE 
e RE MEG MED EE BED GEC EE EE MEC SE SEL EST 
2 HER BRE NE MPE SE S SE BE vem SEE 
S o © o o o PS e å 
pA i E = 8 = s e e e e o g 
a = ao 
ss a R E 8 ER & E & 8º 8 
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As cartas ou os diagramas, como o apresentado na Fig. 1-7, são denomina ~ 
. dos gráficos ilustrativos ou pictogramas (diagramas simbólicos) e são fregiiente- 
mente usados para apresentar os dados estatísticos de modo a despertar a aten- 
ção do público em geral. Muitos dêstes pictogramas apresentam grande dose de 
originalidade e de habilidade na arte de apresentação dos dados. 
Os números à direita dos símbolos do pictograma acima podem, ou não, 
serem incluídos. Mesmo que êles não tenham sido indicados, o leitor pode 
ainda avaliar a população, com a aproxiraação de 5 milhões de pessoas. 


24, Representar graficamente os dados do Probl. 14 usando: 
(a) gráfico de linha; (b) gráfico de barras. 


Solução: 
(a) 
E | Do E 
2 200 ge 
8 
$ 
E) 
o 150 emanen Trigo 
8 em mino Milho 
a O a ya 
2 100 ` so Pe Dom gyl tan) 
f na 
3 
2 
50 
o raaa a i 
1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1800 
àno w 
Fig. 1-8 
RO) 
Primeiro método: Segundo método: 
KB biso 
a00 B Milho 


«a Trigo 
2 milho 


Nóraoro ds Bueholo 


atúmoro ao Bushoto 
g 


a956 


Fig. 1-9 


A Fig. 1-10, acima, é denominada gráfico de barras superpostas. 
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25, (a) Exprimir os números de bushels anuais de trigo e de 
milho do Prob), 14 em percentagens da produção anual total. (b) Re- 
presentar graficamente as percentagens de (a). 


Solução: 
200 


—200 l TTA, a de 
200 + 75 127% 


(a) Em 1950, a percentagem de trigo 


milho = 100% — 72,7% = 27,3%. 
Tabela 1.3 


Anos 1950 1951 1952 1953 1054, 1955 1956 1957 1958 1959 1990 


Pescentagem de | 907 67,3 69,2 746 750 061 056 082 725 67,6 701 


Trigo 
Fercentagem de | org 327 308 254 250 33,9 344 31,8 275 324 29,9 
Taso A 

E mito (b) A representação gráfica das per- 


centagens de (a), apresentada na Fig. 1-11, 
é denominada gráfico de percentagens com- 
plementares em barras. Pode também ser 
usado um gráfico semelhante ao do pri- 
meiro método do Probl, 24(b). 


26. Usando um gráfico de li- 


E produção de trigo da Tabela 1.1. 
RE do Probl, 14. 


OS IDSA 1053 3956 1937 1558 10591000 
dna 


Fig. LI 


IR 
1060 1051 1092 1 


Solução: 
O gráfico de linha pedido é obtido daquele do Probl. 240), mediante a remo- 
ção do gráfico inferior. Em resultado, restará um espaço inútil, entre & linha 
superior do gráfico e o eixo horizontal. Para evitá-lo, pode-se iniciar a escala 


* 250 e 


$ 
a 
E a 
a 200 
d 
Q 
A 
5 150 
É 
s mea mm 
Z A RALO 
o E: 
-r ER T E ul T Į T 
1850 1951 1052 1959 1954 1955 1956 1957 1958 1959 1860 


Ano 
Fig. 1-12 


nhas, represêntar graficamente a” 
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vertical em 150 bushels, em vez de O, Isso pode, entretanto, conduzir a con» 

- clusões errôneas por parte do leitor que não se apereeba da omissão do zero, 

Para chamar a atenção para esta omissão, pode-se 
construir o gráfico, como na Fig. 1-12, abaixo. 

Outro dispositivo frequentemente empregado i 

para chamar a atenção sôbre a omissão do zero 

consiste no uso de uma linha em ziguezague em um 

dos eixos, como está indicado na Fig, 1-13, acima. 


27. As áreas dos vários continentes bA 
do mundo, em milhões de milhas quadra- PRE di em meus 


des, estão apresentadas na Tabela 1-4. 2050 a05i 2054 4055 
Representar grâficamente os dados. Fig. 1-18 


Primeiro método: 
ÁREAS DOS CONTINENTES DO MUNDO 


(segundo dados fornecidos pelas Nações Unidas) 


ÁFRICA 
ÁSIA 


EUROPA 
AMÉRICA DO NORTE 
OCEANIA 
“AMÉRICA DO SUL É 
U.R.S.s. 


1284 645078 JMN 
Áreos (milhõis do milhas quadradas) 


Fig. 1-4 


` Tabela 1.4 O gráfico acima é de bar 
ÁREAS DOS CONTINENTES horizontais em vez de vor 
DO MUNDO Note-se que os continentes pode- 
= rão ser relacionados em ordem 
Área alfabética. Se se desejar, ĉles po- 
Continente are derão ser relacionados em ordem 
quadradas) crescente ou decrescente das áreas, 
átrica 11,7 Nota 1. Da Europy estão excluídos 
sia 10,4 eT ER H 
Europa Lg 2 Rússia e os países sob seu 
América do Norte 94 domínio, que estão incluídos 
Oceânia, 33 na URSS. 
América do Sul 8,9 a 
URSS. SAD o Nota 2 


Totaj 51,5 


(Ponte: Nações Unidas) 
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ÁREAS DOS CONTINENTES DO Segundo método: 

o ilhões de milha É 
MUNDO (milhões de milhas qua A Fig 1-15 é denominada gráfico 
dradas) 


em selores, gráfico circular ou cartograma 
em setores. Para construílo, parte-se do 
fato de que a área total, de 51,5 mi- 
lhões de milhas quadradas, corresponde 
ao número total de graus de um arco de 
circunferência, particularmente 360º. En- 
tão, 1 milhão de milhas quadradas cor- 
. responde a um arco de 360º/51,5. Se- 
América gne-se que à África, com 11,7 milhões 
do Norte de milhas quadradas, corresponde um 
arco 11,7 (360º/51,5) = 82º; enquanto que 
à Ásia, Europa, América do Norte, Oce- 
ânia, América do Sul e URSS. corres- 
pondem os arcos de 73º, 13º, 66º, 23º, 48º 
e 55º, respectivamente. Usando-se um 
Fig. 1-15 transferidor, traçam-se as linhas divisó- 

rias necessárias. 
28. O tempo T (em segundos), necessário para a oscilação com- 
pleta de um pêndulo simples de comprimento L (em centímetros), 


é dado. pelas seguintes observações obtidas em ùm laboratório de, 


fisica. (a) Apresentar gráficamente T em função de L. (b) Ava- 
liar T, por meio dêsse gráfico, para um pêndulo cujo comprimento 
é de 40 centímetros. ` 
O aa i a a ça 
L 10,1 162 22,2 338 42,0 534 66,7 74,5 866 100,0 
T 0,64- 0,81 0,95 1,17 1,30 147 1,65 1,74 1,87 201 


Solução: . 

(a) O gráfico indicado na Fig. 1-16 foi obtido ligando os pontos de obser- 
vação por meio de uma curva regular. 

(0). “O valor de T avaliado é 1,27' segundos. 


$ 
i 
i 
t 
i 
' 
, 
, 
i 
1 
i 
1 
T 


T peepee 
se so so 7 80 s 100 


Fig. 1-16 
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Equações 
E 29. Resolver cada uma das seguintes equações: 

(a) 4a — 20 = 8. 


Adicionando 20 a ambos os membros: 4a -- 20 -+ 20 = 80 -+ 20.. 4a = 28. 
Dividindo ambos os membros por 4: 4a/4 E 28/48 Ca = 7, 


Conferindo: 47) — 20 =8..28-290=8/.8=8. 
(6) 3X +4 = 24- 2X. 


Subtraindo 4 a ambos os membros: 3X + 4 = 4 = 24 — $ 
3X = 20 — 2X. ; ii SSE ES 


: pia 2X a ambos os membros: 3X + 2X = 20 — 2X + 2X. 
“5X = 20. o 


Dividindo ambos os membros por 5: 5X/5 = 20/5.. X = 4. 
Conferindo: 3(4) + 4 = 24 — AM 12 +4 = 24 8/16 = 16. 
Êste resultado pode ser obtido muito mais ràpidamente, sabendo-se que 


qualquer têrmo pode ser movimentado ou transposto de um membro de uma eque- 
são para o outro, apenas com a troca do sinal. Assim, pode-se escrever: 


3X +4 = 24 — 2X 0. 3X +2X = 24 —40,5X = 20.. X = 4 
(©) 18 — 5b = 3@ + 8) + 10. i 


18 ~ 5b = 3b -+24 -+10 <. 18 — 5b = 3b -H34 


Transpondo, — 5b — 3b = 34 — 18 ou — 8b= 16. 


Dividindo por — 8, =e ge mdb a ya -2 
— a 2, 


Conferindo: 18—5(—2) = 3(-2-+8) + 10 “.18 + 10 = 8(6)+10. 2828. 


@ L+2 
3 


Į 
taida 
+ 2 


; Muitiplicam-se primeiramente ambos os membros por 6, que é o mínimo múl- 
tiplo comum dos denominadores. 


r+2 E Y F+2 i 
( 3 DELES] ( 3 ) rom E. 


XY +2) +6 = 3Y 
2Y +4 +6=3F, 2Y +10=3Y, 10=3Y-—2Y, Y=l0. 


ESTATÍSTICA 


no 
co 


erindo: 0+2 pia 10, 2 pis, 441s, ses 
Conferindo: — 3 WI 3 3 + 2 


30. Resolver cada um dos seguintes sistemas de equações si- 
multâneas. 


Multiplicando a primeira equação por 7: 2la — 14b=77 (3) 
Multiplicando a segunda equação por 2: 10a + 14b = 78 (2) 


Adicionando membro a membro: 
Dividindo por 31: 


Observe-se que, inultiplicando cada equação dade, por números apropriados, 
podem-se escrever duas equações equivalentes, (1) e (2), nas quais os coeficientes da 
incógnita b são mumêricamente iguais, porém de sinais contrários. Então, por 
edição; fica-se babilitado a eliminar a ineógnita b e, assim, determinsr a. 
Substituindo a = 5 na primeira equação: 3(5) — 2b = 11 a B=—4,. 
“b=2 É, 

Assim, «=5 e b=2 
» ” 
Gonferindo: 3(5) - 2(2) = 11.. 15 — 4 = 11.. 11 = 11 


5(5) + 7(2) = 39.. 25 + 14 = 39.. 39 an 39. 
(b) f 5X + 14P = 78 
LIX + 3Y =- . 


Multiplicando a primeira equação por 3: 15X + 427 = 284 (1) 


Multiplicando a segunda equação por — tá: — 98X — 42Y 8 (2) 
Somando membro a membro: — 83X =332 . 
Dividindo por — 83 =—4 


Substituindo X = — 4 nè primeira equação: 5(— 4) + 14Y =78/. 
My = 98.. Y = 7. 


Asim X=-4 e Y=7. 


Conferindo: 5(— 4) + 14(7) = 78.1. — 20 + 98 = 78.78 = 78 
U~ A +30) = — 7.. L 28 +2l=—7..— 


(0) {3a + 2b + 5e = 15 
Ta — 3b + 2e = 52 
do + b—&c= 2. 
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Multiplicando a primeira equação por 2: da + 4b + 10c = 30 
Multiplicando a segunda equação por —5: —35a + 15b — 1 260 
Somando membro a membro —29a + 19b ~ 230 (3) 
Multiplicando a segunda equação por 2: . lda— Gb+ de= 104 
Repetindo a terceira equação dat b- dem 2 
Somando 19a — 5h = 106 (2) 


Assim, elimina-se c € ficam duas equações, (1) e (2), a serem resolvidas simul- 
tâneamente para q e b. 


Multiplicando a equação (1) por 5: = 145a + 95b = — 1150 
Multiplicando a equação (2) por 19: 36la — 95b =  Z014 
Somando membro a membro 216a = 864 

Dividindo por 216 a=4 

Substituindo a = 4 em (1) ou (2), nós encontraremos b = 6. E 
Substituindo a = 4 e b= — Gem qualquer das equações dadas, obtém-se 


c=3. ` 
Assim, a = 4, b= —6 e c= 3, 


Conferindo: MA + A~ 6) +53) = 15 “. 15 =15. M4) = 3(=6) +. 
+23) = 52 0 52= 52, 54) + (= 6) = 4B) =2 ' 2=2 


Desigualdades 


31. Exprimir em palavras o significado de cada uma das se- 
guintes relações: 


ta) N> 30 N é maior do que 30. 

bw) Xs12 X é menor do que ou igual o 12. 
() 0<ps1 p é maior do que O e menor do que ou 
igual a 1. 

td) p- U<X<u4+U X é maior do que (u — 24) e menor do 
que (yu + 24). 


32. Traduzir em símbolos as seguintes expressões. 


ta) A variável X tem valores compreendidos entre 2e 5, inclusive: 2 E X 55 


tb) A midia aritmético X é maior do que 28,42 e menor do que 31,56: 
:28,42 < X < 31,55, s é . 


te) m é um número positivo menor do que ou iguala 10: O <m S10. 


i) P é um número não negativo: P20. 


30 - ESTATÍSTICA 


33. Usando os símbolos de desigualdades, ordenar os números 
3,42; — 0,6; — 2,1; 1,45 e — 3 em (a) ordem crescente e (b) ordem 
decrescente de grandeza. 


Solução: 
(a) —-3<-BI<—06<145<342 
(b) 342 >145>—-06>-21>—3. 


Note-se que, quando os números são marcados como pontos sôbre uma linha 
(veja Probl. 18), êles crescem da esquerda para è direita. 


34. Em cada uma das seguintes, determinar uma desigual- 
dade para X, ie. resolva cada desigualdade em relação a X. 


(a) 2X <6. Dividindo ambos os membros por 2, obtém-se X < 3. 


(b) 3X —3 z4 Somando 8 a ambos os membros, 3X = 12; dividindo 
ambos os membros por 3, XX 4. 


(e 6-4X<—2 Somando — 6 a ambos os membros, — 4X < — 8; 
dividindo por ~ 4 X> 2. 


Note-se que, como nas equações, pode-se transpor um têrmo de um membro 
de uma desigualdade para o outro, apenas mediante a troca do sinal, 3X = 8 + 4. 


(d) —3 < Zia 3.. Multiplicando por 2, ~6.< X — 5 <6; soman- 
do 5, =1<X<1L 

(O) -is 22x <7. Multiplicando por 5, — 55S 3 — 2X S 35; so- 
mando — 3, ~ 8 S — 2X E 32; dividindo por — 2, 4 = Xz -16 ou -16s 
sxa 


Logaritmos e antilogaritmos 


35. Determinar a característica dos logaritmos decimais de 
cada um dos seguintes números. 


(a) 57 (d) 35,63 (9) 186000 (7) 0,0325 
(b) 574: (e) 982,5 “(bon (k) 0,0071 
(e) 5,88 G) 7824 (1). 0,7314 (1) 0,0003 
@ i Do DIS G) 9—19 (k) 7—10 


DIDI DI A 9—10 (j) 8—10 (1) 6 — 10. 
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36.. Verificar cada um dos seguintes logaritmos. 


(a) log 87,2. Mantissa = 0,9405; característica == 1; então, log 87,2 = 


= 1,9405. 

(b) log 37300 = 4,5717 (d) log 9,21 = 0,9643 

(o) log 753 = 2,8768 (e) log 54,50 = 1,7364 

G) log0,382. Mantissa = 0,5821; característica =. 9 — 10; então log 0,382 = 
= 9,5821 — 10. 


(g) log0,00159 = 7,2014 — 10 (i) log 0,000827 = 6,9175 — 10 

(h) log.0,0753 = 8,8768 — 10 (j) log 0,0503 =.8,7016 — 10 

(k) log4,638. A mantissa do log 4638 está situada entre as dos log 4 630 è 
log 48940 e » 8 décimos do pri é `. 


Mantissa do log 4 640 = 0,6665 Mentissa do log 4,638 = 0,6056 -+ 
Mantissa do log 4 630 = 0,6858 + (0,8)(0,0009) = 0,6663 com qua» 
Diferença tabular = 0,0009 tro algarismos, 
Então log 4,638 = 0,6663. 


Esse processo é denominedo . interpolação linear. Se so desejar, a tabela 
das partes proporcionais, das páginas 565 e 566, pode ser usada para fornecer a 
mantissa- diretamente (6 656 + 7). 


(1) Jog 6,758 = 0,8295 . (8208 4 2) 
(m) log 183,2 = 2,2630 (2625 + 5) 
(n) log 43,15 = 1,6350 (6345 + 5), - 
(0) log 876 400 = 5,9427 (9425 + 2) 
(p) log 0,2548 = 9,4062 — 10 ` (4048 + 14) 
(q) Jog 0,04372 = 8,6407 — 10 (6405 + 2) 
(r) log 0,009848 = 7,9933 — 10 , (9 930 + 3) 
(5) log 0,0001788 = 6,2524 — 10 (2 504 + 20). 


37. Verificar cada um dos seguintes antilogaritmos. 


(a) antilog 1,9058. 


Na tabela, a mantissa 0,9058 corresponde ao número 805. Visto que a carac- 
terística é 1, o número deve ter dois.algarismos antes da vírgula; então, o número 
pedido é 80,5, i.e antilog 1,9058 = 80,5, 

(b) antilog 3,8531 = 7130, antilog 2,1875 = 154, antilog 0,4997 = 3,16, 
antilog 4,9360 = 86 300. 

(c) antilog 7,8657 — 10. 

Na tabela, a mantissa 0,8657 corresponde ao número 734. Visto que a carac- 


terística é 7 — 10, o número deve ter dois zeros imediatamente após a vírgula. 
Portanto, o número pedido é 0,00734, i.e., antilog 7,8657 — 10 = 0,00734. 
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A tabela de partes proporcionais, das páginas 565 e 566, pode ser usada. 
(d) antilog 9,8267 — 10 = 0,671, antilog 2,23927 = 0,0247, antilog 7,7443 — 
— 10 = 0,00555. 
(e). antilog 9,3842 — 10. 
Visto que a mantisss não é encontrada nè tábua, deve-se proceder à interpo- 


loção. 
Mantissa de log: 2 430 = 0,3856 Mantisse dada. = 0,3842 
Mantissa de log 2 420 = 0,3838 Mentisss imediata- 
mente inferior = 0,3838 
Diferença tabular = 0,0018 * Diferença = 0,0004 


Entäo, 2 420 + (4/18)(2 430 — 2 420) =2 422, com quatro algarismos, € o 
número pedido é 0,2422. 

Y) antilog 2,6715 = 469,3 
antilog 4,1853 = 15,320 
antilog 0,9245 = 8,404 

(6) antilog 1,6089 = 0,4064 
antilog 8.8907 — 10 = 0,07775 (3/6 X10 = 5) 
entilog 1,2000 = 15,85 (13/27 X 10 = 5 aproximadamente) 


(8/9 .X10=3 aproximadamente) 
(6/28 X 10 =2 aproximadamente) 
(25 X 10 =) 

(411 X 10 = 4 aproximadamente) 


Cálculos comi emprêgo de logaritmos 
Calcular cada uma das seguintes expressões, com o emprêgo 
de logaritmos. ' PF demais, fist i " 
38, P = (3,81)(43,4). 
log P = log 3,81 + log 43,4 
log 3,81 = 0,5809 
(+) log 43,4 = 1,6375 


log P = 22184. Então, P = antilog 2,2184 = 165,3 ou 185, com 
3 algarismos significativos. 


Note-se o significado exponencial do cálculo, Assim, (3,81)(43,4) = (10989) 
(016975) co 1004SHOHS a 1022188 = 165,3. 


39. P = (73,42)(0,004620)(0,5143). 


log P = log 73,42 + log 0,004620 + jog 0,5143 
log 73,42 = 1,8658 


(+) log 0,004620 = 7,6646 = 10 
CH) log0,5143 = 9,7112 — 10 


P 


19,2416 — 20 = 9,2416 — 10. Então P = 0,1744. 


4 


log 
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40. p= (7840) (00481) 


28,23 
log P = log 784,6 + log 0,0431 — log 28,23 
Jog 784,8 = 2,8947 
(+)iog 0,0431 = 86345 — 10 
11,5292 — 10 
(—)log 28,23 =` 1,4507 
log P = 10,0785 — 10 = 0,0785. Então, P= 1,198 ou 1,20, com 3 


algarismos significativos. 


Note-se o significado exponencial do cáleulo, Assim, 


(784,0) (0,0431) (1078037) (rg asso 7 f 
283 JoL Da 103/8947+8,6346-10-1,4607 p 70,0785 my 1,198. 


4}. P = (53958. 

log P = 8 log 5,395 = 8(0,7320) = 5,8560; e P = 717 800 ou 7,178 X 10º, 
42, P=3872 = (387,2), 

log P = -i log 387,2 = $ (2,5879) = 1,2940; e P = 19,68. 


43. P=. (0,08317)5.. 


log P = Flog 0,08317 = + (8,9200 — 10) = 3 (49,9200 — 50) = 9,7840 — 
— 10; e P = 0,6081. 


44, Ps 1 


log P = É log 0,003654 -+3 log 18,37 — {4 log 8,724 + + log 743,8) 
Numerador N 


+ log 0,003654 


H 


+ (7,5628 — 10) 


= (17,5628 ~ 20) = 8,7814 — 10 
3 log 18,37 = 3 (1,2041) = 
Somando log N = 
(=) log D = 
log P = 
P = 


“o 
Es 


ESTATÍSTICA 


Denominador D 
4 l0g 8,724 = 4(0,9407) = 3,7628 
+ log 743,8 = + (2,8714) = 0,7178 
log D = 4,4805 


g p q EA0308) 
É (1,754)4(0,007352) 


log P = + llog 874,3 + log 0,03816 + 3 log 28,53 — (4 log 1,754 -+ log 0,007952)] 


log 874,3 = 2,9417 = 29417 
log 0,03816 = 8,5816 — 10 = 8,5816 — 10 

3 log 28,53 = 3(1,4553) = 4,3659 
Somando 15,8892 — 10 
(=) 3,8424 — 10 

7,0468 

4 log 1,754 = 4(0,2440) = 0,9760 
log 0,007352 = _7,8664 — 10 
Somando 8,8424 — 10 


Então, log P = + (7,0468) = 3,5234; e P=3338. 


Problemas Suplementares 
Variáveis d 

46. Dizer quais dos seguintes rèpresentam dados discretos e quais repre- 
sentam dados contínuos. 

(a) Altura de precipitação da chuva ern centimetros, de uma cidade durante 
vários meses do ano. ę 

(b) Velocidade de um automóvel em km/h. 

(c) Número de notas de vinte dólares em circulação nos Estados Unidos, 
em qualquer época. 

(d) Valor total das ações vendidas diariamente na Bôlsa de Valores. 

(e) Número de estudantes matriculados em uma universidade, em certo 
número de anos. É 


Resp.: (a) continuos; (b) continuos; (c) discretos; (d) discretos; (e) discretos. 


47. Dar o domínio de cada uma das seguintes variáveis e dizer se são variáveis 
contínuas ou discretas. 


(a) Número W de bushels de trigo produzidos por hectare em uma fazenda, 
durante certo número de anos. z 


(b) Número N de indivíduos de uma família. 
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(© Estado civil de um indivíduo. 

(d) Tempo T da trajetória de um projétil. 

(e) Número P de: pétalas de uma flor. 

Resp.: (a) De zero para cima, continua. (b) 2, 3, ...; discreto. (c) Solteiro, 
casado, divorciado, desquitado, viúvo, discreta. (d) De zero para cima, contínua. 
(é) 0, 1, 2, ..., discreta. 


Arredondamento de dados, notação científica « algarismos significativos 


48. Arredondar cada um dos seguintes números para a aproximação pedida, 


(a) 3256 para centenas U) 3502378 para milhão 

(b) 5,781 para décimos (g) 148,475 para unidades simples 
(c) 0,0045 para milésimos (h) 0,000098501 para milionésimos 

(d) 46,7385 para centésimos (i) 2184,73 para dezenas 


(e) 125,9995 com duas casas decimais (j) 43,87500 para centésimos. 


Resp.: (a) 3300; (b) 5,8; (c) 0,004; (d) 46,74; (e) 126,00; (f) 4000 000; 
(9) 148; (h) 0,000099; (à) 2180; (5) 43,88. E 


49. Exprimir cada número sem usar as potências de 10. 


(a) 132,5 X 10%; (b) 418.72 X 10%; (c) 280 X 107; (d) 7300 X 108; 
(e) 3,487 X 1074; (J) 0,0001850 X 108. 


Resp.: (a) 1325000; (b) 0,0041872; (e) 0,0000280; (d) 7 300 000.000; 


“(e 0,0003487; Q) 18,50. 


50. Quantos algarismos significativos tem cada um dos seguintes números, 
considerando-os como tendo sido registrados com precisão. 
(a) 254em (d) 3,51 milhões de bushels (g) 378 onças 
(b) 0,004500 jardas (e) 10,000100 pés (h) 4,50 X 107% km 
(co) 3510 000 bushels (1) 378 pessoas (i) 500,8 X 10º kg 
(j) 100,00 milhas. 


Resp.: (a) 3; (b) 4; (c) 7; (d) 3; (e) 8; (J) ilimitado; (9) 3; (A) 3; (1) 4; (J) 5 
51. Qual é o êrro máximo em cada uma das seguintes medidas, consideradas 
como anotadas exatamente ? 
ta) 7,20 milhões de bushels tc) 5280 pés (e) 186000 milhas por seg, 
(b) 0,00004835 centímetros (d) 3,0 X 108 metros (4) 186 mit milhas por seg. 
Resp.: 
(a) 0,005 milhões ou 5000 bushels; td) 0,05 X 108 ou 5 X 10º m 2 


tb) 0,000000005 ou 5 X 10º em; (e) 0,5 milhas por segundo; 6 
(e) 9,5 pés; {/) 0,5 mil ou 500 milhas por seg.; 3 
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52. Escrever cada um dos números seguintes, usando 2 notação cientifica. 
Considerar todos os algaris significativos, a menos que haja indicação em 
contrário. 


(a) 0,000317; (b) 428 000 000 (quatro algarismos significativos); (e) 21 600,00; 
(d) 0,000009810; (e) 732 mil; (f) 18,0 décimos milionésimos. 


Resp: (a) 317 X 107%; (b) 4,280 X 10°; (c) 2,160000 x 10%; (a) 9,810 X 
X107; (e) 7,82 X 10%; (1) 1,80 X 10%. 


Cálculos 


53. Mostrar que (a) o produto e (b) o quociente dos números 72,48 e 5,16, 
admitidos como tendo quatro e três algarismos significativos, respectivamente, 
não podem ter mais do que três algarismos significativos exatos. Escrever o 
produto e o quociente precisamente. 


Resp: (e) 374; (9) 14,0. 


54. Efetuar cada uma das operações indicadas. A menos que esteja espe- 
cificado de outro modo, considerar que os números foram anotados exatamente. 


873,00 
(a) 0,36 X 781,4 0) 4881 
0,00480 X 2 300 
, 27 , O doe aa 
(e) 5,78 X 2700 X 16,00 (d) 0,2084 


(e) v 120 X 0,5350 X 0,46014 (120 exato) 
y (416 000)(0,000187) i 


73,84 
(9) 14,8641 + 4,48 — 8,108 + 0,36125 


(k) 4173000 — 170264 + 1 820 470 — 78320. (Os números são precisos, res- 
pectivamente, com 4, 6, 6 e 5 algarismos significativos.) 


(3,6 e 7 são exatos) 


J = (5,075) 
0,0001980 


i 


Resp.: (a) 280 (dois algarismos significativos), ou 2,8 centenas, ou 2,8X10º; 


(b) 178,9; (e) 250 000 (três algarismos significativos), ou 250 mil, ou 2,50 X 3086 


(d) 53,0; (e) 5,461; (4) 9,05; (g) 14,54; (h) 5 745 000 (quatro algarismos signi- 
ficativos) ou 5745 mil ou 5,745 milhões, ou 5,745 X 108; (1) 1,2; () 4157. 


=18 W=3,) 


meros como exatos. 


S 
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(a) 4U +6F — 2W - 


XYZ 
b PR dA 
rw 
ty QE-S 


UR FX 
(O) KU-NXP+Y 
O ves rw 


Resp: (o) — 11 MD — 16 
(6) 2 (9) VIS, on 9.80901 aprox. 
(e) 35/8 ou 4,375 (h) = ÍV, ou — 1,20049 aprox. 
(d) 21 (i) 32 
(3 G) 10/4117, ou 2,42530 aprox. 


Funções, tabelas e gráficos 


56. A variável Y é determinada em função da variável X, por meio da se- 
guinte equação Y = 10 — 4X, 


(a) Determinar Y quando X = —3,-2,-1,0,1,23,45€ apresentar: 
os resultados numa tabela, 
(b) Determinar Y quando X = — 24 — 16 — 0,8, 18, 2,7, 35, 4,6. 
(ce) Se a dependência entre Y e X fôr representada por Y = F(X), deter- 
minar P(2,8), PO 5) P(V2), PE T). 
(d) Quais os valores de X que correspondem a Y= -2 6 
16, 0, 10? É dar Bau rg loga arde tesao ue 
te) Exprimir X explicitamente como função de F. 
Resp.: (a) 22, 18,14,10,6,2, — 2, — 6, — 10 
{b) 19.6, 16,4, 13,2, 2,8, — 0,8, — 4, — 84 
() = 1,2, 30, 10 = 4V2 = 4,34 aproximadamente, 10 + 4w = 
= 22,57 aproximadamente. 
(d) 3, 1, 5, 2,1, — 1,5, 25, 0. 
(e) X=} 00- Y). 


- 1018, 


57. So Z= Nº Y? dewrminar Z quando: (a) X = = 2, Y ; W 
X=1, Y =5. (c) Usando a notação funcional Z=(X,Y), determinar P (—3,— 1). 
Resp: (a) —5; (b) — 24; (e) 8. 
58. Se jF = ~ 4Y? + 2XY, determinar W quando: (a) X = 1, Y œ 


=—2,Z = (1 Y = —2,Z=0. (ce) Usando a notação funcional 
W = PX, Y, Z), achar P (3,1! — 2). ERTS 


(a) — 8; (4 (© — 18. 


stema de coordenada: 
(a) (3;2). 
Sh yli- 


tangulares, os puntos que têm 
tip ta; — 4), 
iD (O; = 3), 


1) (1,8; 0). 
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60. Representar graficamente as equações: (a) Y=10-4X (veja Probl. 56), 
W) P=2X+5, (o) Y= (X = 6)’ (0) 2X +3Y = 


61. Representar gràficamente as equações: (a) Y =2X +X — 10, (b) 
Y = 6 =~ 3X — X. : 

62. Representar graficamente a equação Y = X? - 4X? + 12X — 6. 

63. A tabela seguinte mostra os números de trabalhadores agrícolas e de 
outras atividades nos Estados Unidos, nos anos de 1840 a 1950. Representar 


graficamente os dados empregando: (a) gráfico de linhas, (b) gráfico de barras, 
(c) um gráfico de barras complementares: 


ANO 1840 1850 1800 1870 1880 1800 1900 1910 1920 1930 1940 1950 
Trabalhadores ` 
Agricolas 37 49 62 69 86 99 109 11,6 114 10,5 88 6,8 
(milhões) 
Trabalhadores 


Não-Agrícolas 17 28 43 L 88 134 182 258 31,0 384 429 52,2 
(milhões) 


(Fonte: ` Departamento do Comércio, Serviço de Recenseamento) 


64. Traçar um pictograma apropriado para representar à variação dos 
números de (a) agricultores, (b) não-agricultores, para os dados do problema 
precedente. Poder-se-á traçar um pictograma que mostre as variações tanto 
de (a) como de (b)? i 

65. Usando os dados do Probl. 63, construir um gráfico que mostre & percen- 


tagem de todos os trabalhadores que são: (a) agricultores (b) não-agricultores, 
Poder:se-á traçar um gráfico que mostre as partes (a) e (b) simultâneamente ? 


66. A tabela seguinte apresenta as taxas de nascimento e de mortalidade 
em 1000 pessoas, nos Estados Unidos, nos anos de 1915 a 1955. Representar 
graficamente os dados, usando um tipo de gráfico apropriado. g 


Ano 1915 1920 1925 1930 1935 1940 1945 1950 1955 


Taxa de 
nascimento 25,0, 237 21,3 18,9 16,9 17,9 195 23,6 24,6 


(por 1000 pessoas) 


A | rem 


Taxa de i 
raortalidade 13,2 13,0 17 113 10,9 10,8 10,6 96 93 


(por 1000 pessoas) 


. (Fonie: Departamento da Saúde, Educação e Bem-Estar} 


2 (3X -2 = 8, . 
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67. A tabels seguinte mosira as alturas dos sete wesioros editicion o 
turas no mundo. Representar graficamente os dados, ussodo um değ 
epropriado. 


Edifício ou estrutura Localização 


l 


Erapire State Building New York 1250 
Chrysler Building New York 106 
'Tôrre Eiffel Paris EENI 


Wall Street Building 
Banco de Manhattan 
R.C.A. Building, Rockefeller Center 
Woolworth Building 


68. A tabela seguinte mostra as velocidades orbitais dos planêtas de nosso 
sistema, solar. Representar graficamente os dados, 


Planêta 


Velocidade 
(milhas/seg. ) 


69, A tabela seguinte mostra o estado civil de homens e mulheres (de 14 
anos ou- mais), nos Estados Unidos, no ano de 1958. Representar graficamente 
os dados, usando dois gráficos em setores que tenham o mesmo diâmetro. 


Estado Civil Homens 
(percentagem do total) 


eras 
(percentagera do total) 


Solteiro 2 


24,5 
Casado 89,3 
Viúvo 3,9 
Divorciado 18 


(Fonie: Serviço de Recenseamento) 


79. A tabela seguinte mostra as áreas, em milhões de 
dos oceanos. Representar graficamente os dados, usando (a) um 
(b) um gráfico em setores. 


Oceano Pacífico Anansi | traio | Axtáriico 
é hi Área i | p 
milhões de milhas qua- 70,8 41,2 Z8, õ ; 
dradas) ` d | G 4 Á 
RR EENE EENE DEERE 


| 
| 
| 
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71. Resolver cada uma das seguintes equações: É 


(a) 16 — 5e = 36 (d) 3U + 1) = 58 — U) +3(U — 2) 
6) 2Y —6 = 4- 3Y te) 3IXX + 1) — 4] = 10 — 5(4 — 2X) 
() 4X--11=15-2UX+9) 9) $A2+Y)=6-40- Y) 


Rep: (0) -4 DB OS DE DU QT 


72. Resolva cada uma das seguintes equações: 


(a) 420 + db = 10 (b) Pa (e) audio 
tTa — 3b = 9 2a -3b = 14 3X +7Y = —9 
(a) E T (e) (2a+ b— c=2 
34 — 4B = 16 3a — 4b + Ze = 4 
4a + 3b — 5c = — 8 


U) {5X +29 +32 = -5 @) (BU —~5V + 6W=7 
2X — 3Y = 6Z = 1 SU 3V — 2W = — Í 
X + 5Y -- 42 = 22 4U — 8V + 10W = 11. 
Resp.: 
(0) a=3,b=4 ©) a= -2b=6 (à X=-02 P=-12 


(d) A = 184/7 = 26,28571 aprox., B = 110/7 = 15,71429 aprox. 
(e) a=2,b=38,0=5 (() L=-1Y=3Z2=—2 
(9) U =0,4, V = — 08, W = 0,3. 


«PB (0) . Representar graficamente asequações 5X +2Y=4e 7X —3Y= 
= 23, usando o mesmo sistema de coordenadas, (b) Determinar pelo gráfico 
a solução simultânea das duas equações. (c) Usar êsse método para obter a 
solução simultânea das equações (a) a (d), do Probl, 72. 


Resp: (b) (23; — 3), Le, X=2 Y = —3. 


74. (a) Usar o gráfico do Probl, 61(a) para resolver a equação 2X? + X — 
~ 10 = 0. (Sugestão: Determinar o valor de X do ponto em que a parábola 
intercepta o eixo dos X, i.e., onde Y = 0.) (b) Usar o método indicado em 
(a) para resolver a equação 3X? — 4X —5 = 0. 


Resp.: (a) 2; — 25; (b) 21 e — 0,8 aprox. 


75. As soluções da equação geral do segundo grau aX? +bX +c=0 
= bd vb — dae 
2a i 


mula para determinar as soluções das equações: (a) 3X? — 4X — 5=0, @) 
2X? + X — 10 =0, (e) 5X? -+ 10X =7,. (d) Xº+8X+425=0, 


Empregar essa fór- 


i 


são dados pela fórmula quadrática: X 


Resp: (e) tiyn ou 2,12 e — 0,79, aprox; (b) 2, — 2,5 ; (0) 0,549, 


— 2,549 aproximadamente. 
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(a) =8EM 36 -8+ yai 1. Sto Los aus 
= — 4 + 3iem quei = 1 Ensas raízes são números complexos e não apa 
recerão onde fôr empregado processo gráfico. 


Desigualdades 


76. Usando os símbolos de desigualdade, dispor os números — 43; — 6,15; 
2,37; 1,52, — 1,5 em (a) ordem crescente; (b) ordem decrescente de Erandezs. 


Resp: (a) —615<-43<-15<152<237 (237 >152> 
>-15>-43> — 6,15. 


77. Usar os símbolos de desigualdade para exprimir cada ums das seguintes 
proposições: (a) O número N de crishças esté compreendido entre 30 e 50, in- 
clusive; (b) a soma S dos pontos de um par de dados não é menor do que 7; 
(c) X é maior do que ou iguala — 4 e menor do que 3; (d) P é no máximo igual 
25; (e) X excede Y em mais do que 2, 


Resp: (0) 0SNS5; () SET (o) -1SX<3 DPS; 
(QX-r>2 ? . 


78. Resolver as seguintes desigualdades: 


(@) 3X212 (b) 4X <5X -3 
(c) 2N + 15> 10 +3N ce @ BABY =~ 2) £7- 3(4 = Y) 
© -3352X +1) 83 ND 0< È(15 — 5N) <12 


9) —=2<3 + 4 (a 12) <8. 


Resp: (a) X Z4 X> 3; AN <5; a YS; -8s Xt 
U -18 N <3; (g)2 Sa <22 


Logaritmos 


79. Determinar os logaritmos decimais de ceda um dos seguintes números: 


(a) 387 (d) 14630 (9) 476,2 G) 71,46 
(6) 0,387 (e) 0,6042 (h) 1,007 (k) 9,09098 
(0) 0,0792 () 0,002795 © 7146 (I) 84620000. 
i Resp.: É 

(a) 2,5877 (b) 9,5877190 (o) 8,898710 (d) 4,1853 

(e) 9,7812—10 (f) 7,4464—10 (9) 2,6779 (h) 0,0030 

(i) 0,8541 G) 1,8541 {k) 6,9912—10 G) 7O25. 
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89. Determinar o antilogaritmo de cada um dos seguintes logaritmos: 


@) 3.560 0) OBLB-IO O) 1,7045 (à) 8,9266-10 
(6) 24700 U) 64700-10 (9) 2,8003 (h) 3,7072 
ti) 0,0800 U) 6,3841. 

(a) (6) 0,675 (e) 50,64 (à) 0,08445 
(e) 295.1 CD 0,0002951 (g) 0,06314 (h) 5096 

() 1,202 G) 2422000 ou 2,422 X 10°. ` 


81, Calcular cada uma das seguintes expressões, mediante o emprêgo de 


logaritmos. 


21,7 
(a) (783,6) (1,054) (o) ETA 
(0,04556)X024,1) (d) 0,562% 


O qa a20,002572) 
(0.3853 (12,84? 

fe) (0,01382) 

(0 VI. (hj NV ETO)OS SAT, 505,28 8747) 

E (38.70) (0,0057407 SSL 4 (43,25)(0.08743) 

É To O mois Vt9,002350(0,821) 


U) 0,04182 4/0,6758 


Resp: (4) 1296000 ou 1.206 X 10°; (b) 0,05739 ou 0,0574 com 3 alga- 
rismos significativos; (c) 556,0; (d) 804,4; (e) 40,820; (J) 0,0: 8; (9) 15,54; 
(h) 45,67; (i) 0,0004519 = 4,519 X 107! ou 4,52 X 107, com 3 algarismos sig- 
nificativos; (4) 3 086. - 


82. Representar grificamente: (a) Y =log X, Wb)Y= 10¥ e discutir as 
semelhanças entre os. dois gráficos. 


83. Escrever as equações: (a) 2log X — 3 log Y =2 (b) log Y +2X = 
= Jog 3, sob forma que não contenha logaritmos. 


Resp: (a) X? = 1007; (b) Y= 30%). 


84. Se aP = N, onde a è p são números positivos e « * 1, p é denomina- 
do logaritmo de N na base a e escreve-se p = loga N. Caleniar: (a) log: 8 
(b) logos 125, (e) loga 1/16, (d) login 32. (e) logs 1. 


Resp: (0) 3; 03; (O = 23 (D —5 (O 0. 


85. Demonstrar que loge A = 2,303 loga N, aproximadamente, em que 
e = 2,71828... é denominada base natural dos logaritmos è N > 0. 


86 Demonstrar que (logo a) Uoga b) = 1, em que «> 0, b>6 #1, 
bad 


CaríruLo 2 


DISTRIBUIÇÕES DE FREQUÊNCIA 


Dados brutos 


Dados brutos são aquêles que ainda não foram numbricamente 


organizados. Um exemplo é o conjunto das alturas de 100 estudantes , 


do sexo masculino tirado de uma lista alfabética do registro de uma 
universidade. 


Rol 


Um fol é um arranjo de dades numéricos brutos em ordem crese 
cente ou decrescente de grandeza. A diferença entre o maior e o 
menor número do rol chama-se amplitude total dos dados. Por exem- 
plo, se a maior altura dos 100 estudantes do sexo masculino é 188 em 
e a menor 152 cm, a amplitude total será de 36 em. 


Tabela 2.1 Distribuição de fregiiência 
Alturas de 100 estudantes do sexo 
masculino da Universidade XYZ Quando se resumem grandes 


massas de dados brutos, costuma- 


Altura Número de 


(em) estudantes se frequentemente distribuí-los em 

classes ou categorias e determinar 

151 — 158 5 o número de indivíduos pertencen- 

159 — 166 18 tes a cada uma das classes, deno- 

se 7 ia 2 - minado jregiência da classe. Um 

183 — 190 8 arranjo tabular dos dados por 

E l classes, juntamente com as fre- 
Total 100 P SI 3 

ii giiências correspondentes, é deno- 
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minado distribuição de freguência ou tabela de freguência. A Tabe- 
la 2.1 é uma distribuição de frequência das alturas (arredondadas 
para centímetros) de 100 estudantes do sexo masculino da Univer- 
sidade XYZ. 

A. primeira classe ou categoria, por exemplo, contém as alturas 
de 151 cm até 158 cm e é indicada pelo símbolo 151—158. Como 
há 5 estudantes cujas alturas pertencem a essa classe, a frequência 
que lhe corresponde é 5. 

Os dados organizados e resumidos como na distribuição de 
fregiiência acima, são muitas vêzes denominados dados agrupados. 
Embora o processo de agrupamento geralmente inutilize muitos 
detalhes originais dos dados, consegue-se vantagem importante que 
consiste no aspecto global obtido, que se torna mais claro tornando 
evidentes as relações essenciais. 


Intervalos e limites de classe 


Um símbolo que define uma classe, como o 151—158 da Tabe- 
la 2.1, chama-se intervalo de classe. Os números extremos, 151 e 
158 são denominados limites de classe; o número menor, 151, é o 


-- limite inferior da-classe e-o maior, 158, 6 o-limite superior da classe. 


Os têrmos classe e intervalo de classe são, muitas vêzes, permutáveis, 
embora o intervalo de classe seja, realmente, o símbolo dessa classe. 


Um intervalo de classe que, ao menos teôricamente, não tem 
limite superior ou inferior indicado, é denominado intervalo de classe 
aberto. Por exemplo, ao referir-se a grupos de idades de indivíduos, 
o intervalo de classe “65 anos eu mais” é um intervalo de classe 
aberto. 


Limites reais de classe 


Se as alturas são tomadas com arredondamento para centímetros, 
o intervalo de classe 151—158 inclui, teôricamente, tôdas as medidas 


` compreendidas entre 150,50... até 158,50 cm. Esses números, 


indicados abreviadamente pelos números exatos 150,5 e 158,5, são 
denominados os limites reais ou ôs verdadeiros da classe; o menor 
número, 150,5 é o limite inferior real e o maior, 158,5, é o limite su- 
perior real da classe. 


x 
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Na prática os limites reais de classe são obtidos adicionando-se 
o limite superior de um intervalo de classe ao inferior da classe se- 
guinte e dividindo-se a sema por 2. 


Às vêzes utilizam-se os limites reais para simbolizar a classe. 
Por exemplo, as várias classes da primeira coluna da Tabela 2.1 por 
deriam ser indicadas por 150,5-—158,5, 158,5—166,5 ete. Para evitar 
ambigúidades no emprêgo dessa notação, os limites reais de classes 
não devem coineidir com as observações reais. Assim, se houvesse 
uma determinação de 158,5, não seria possível decidir se ela, pertence 
ao intervalo da classe 150,5—158,5 ou da 158,5-—166,5. 


Amplitude do intervalo de classe 5 

A amplitude do intervalo de uma classe é a diferença entre os 
limites reais superior e inferior dessa classe e € referida, também, 
como a amplitude, o tamanho ou o comprimento da classe. Se todos 
os intervalos de classe de uma distribuição de frequência tiverem 
amplitudes iguais, êsse valor comum será representado por c. Nesses 
casos, c é igual à diferença entre dois limites inferiores, ou dois superio- 
res, sucessivos de classe. Para os dados da Tabela 2.1, por exemplo, 
a amplitude de classe é c = 158,5 — 150,5 = 166,5 — 158,5 = 8. 


Ponto médio de uma classe 


É o ponto intermediário do intervalo da classe e é obtido soman- 
do-se o limite inferior ao superior e dividindo-se a soma por2. Assim, 
o ponto médio do intervalo 151—158 é (151 + 158)/2 = 154,5. 


Para as finalidades das análises matemáticas ulteriores, admite-se 
que tôdas as observações relativas a um determinado intervalo de 
classe coincidem com seu ponto médio. Dessa maneira, tôdas as 
alturas do intervalo de classe 151 — 158 em são consideradas como 
sendo 154,5 em. 


Regras gerais para elaborar uma distribuição de freguência 


à. Determinam-se o maior e o menor número dos dados brutos 
e, então, calcula-se a amplitude total do rol (diferença entre o maior 
e o menor daqueles números). 
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2, Divide-se a amplitude total em um número conveniente de 
intervalos de classe que tenham a mesma amplitude. Se isto não 
é possível, usam-se intervalos de classe de amplitudes diferentes ou 
abertos (veja Probl. 12). O número de intervalos de classe é co- 
mumente tomado entre 5 e 20, dependendo dos dados. Os intervalos 
de classe são escolhidos também, de maneira que seus pontos médios 
coincidam com dados realmente observados. Isso tende a diminuir 
o denominado êrro de agrupamento que surge em análises matemáticas 
ulteriores. Entretanto, os limites reais de classe não coinéidiriam 
com dados realmente observados. 

3. Determina-se o número de observações que caem dentro 
de cada intervalo de classe, isto 6, caleulana-se as frequências de classe. 
Isso é obtido da melhor maneira mediante a utilização de uma tabu- 
lação ou mapo de apuração (veja o Probl. 8). 

Histogiamas é poligonos de fregiiência são duas representações 
gráficas de distribuições de frequência. 

1 Um histograma ou histograma de fregiência consiste em um 
conjunto de retângulos que tem: 

(a) as bases sôbre um eixo horizontal (eixo dos X) com centro 
no ponto médio e as larguras iguais às amplitudes dos intervalos 
das. classes; Bg ; ; 

(b) as áreas proporcionais às frequências das classes. 

Se todos os intervalos tiverem a mesma amplitude, as alturas 
dos retângulos serão proporcionais às frequências das classes e, então, 
costuma-se tomar ss alturas numêricamente iguais a essas freguên- 
cias. Se os intervalos de classe não tiverem a mesma amplitude, essas 
alturas deverão ser ajustadas (veja o Probl. 13). 

2 Um polígono de fregiência é um gráfico de linha em que as 
frequências são locadas sôbre perpendiculares levantadas nos pontos 
médios. Pode-se também obtê-lo, 
ligando-se os pontos médios dos 
topos dos retângulos de um his- 
tograma. É 


ao 


O histograma e o polígono 
de fregiência correspondentes à 
distribuição de frequência das altu- 
ras dos estudantes, antes apresen- 


147 155 163 AZ 179 087 195 
Altura teontimotros} 


Fig. 20) tadas, estão desenhados, sôbre o 


Súmoro do Zstudantos (Frequência) 


cap. 2 DISTRIBUIÇÕES DE FREQUÊNCIA 4t 


mesmo sistema de eixos, na Fig. 2-1, Costuma-se acrescentar seg- 
mentos PQ e R$, que vão ter aos pontos médios imediatamente in- 


ferior e superior e cujas freqüências são nulas. Nesse caso, a 


soma das áreas dos retângulos do histograma é igual à área total 
limitada pelo polígono de frequência è o eixo dos X (veja Probl. 11). 


Distribuições de fregiiência relativa 


A frequência relativa de uma classe é a dessa classe dividida pela 
total de tôdas elas e é, geralmente, expressa em percentagem. 


Por exemplo, a frequência relativa da classe 167174 da Ta- 
bela 2.1 é 42/100 = 42%. A. soma das fregiiências relativas de tôdas 
as classes é, lôgicamente, igual a 1 ou 100%. 


Se es fregiências da tabela citada forem substituídos pelas 
relativas correspondentes, a tabela resultante denominar-se-á dis- 
iribuição de frequência relativa, distribuição percentual qu tabela de 
jregiências relativas; 


As representações gráficas das distribuições de freqüência relativa 
podem ser deduzidas do histograma ou do polígono de frequências, 
mediante a simples modificação da escala vertical para as frequências 
relativas, conservando-se exatamente o mesmo diagrama, Os grå- 


ficos resultantes são denominados histogramas de jregiência relativa ` 


ou percentuais e polígonos de fregiiência relativa ou percentuais, res- 
pectivamente. 


A frequência total de todos os valores inferiores ao limite superior 
de um dado intervalo de classe é denominada, jregiiência acumulada 
até e inclusive aquéle intervalo. Por exemplo, a frequência acumu- 
lada até e inclusive o intervalo de classe 167 — 174 da Tabela 2.1 é 
5 + 18442 =65, o que significa que 65 estudantes têm alturas 
inferiores a 174,5 em. 

Uma tabela que apresente essas frequências acumuladas deno- 
mina-se distribuição de jregiência acumulada, tabela de jregiiência 
acumulada ou, abreviadamente, distribuição acumulada e é exemplifi- 
cada na Tabela 2.2 para a distribuição das alturas dos estudantes, 
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Um gráfico que apresente a fregliência acumulada abaixo de 
qualquor limite superior de classe, locada em relação a êsse limite é 
denominado polígono de fregiência acumulada ou ogiva e é mostrado 
na Fig. 2-2 para a distribuição de altura dos estudantes. 


wd - Tabela 2,2 
ge Altura Número de 
E (em) estudantes 
É 
E wd Abeixo de 151 0 
E Abaixo de 159 5 
È 204 Abaixo de 167 23 
Abuixo de 175 65 
Abaixo de 183 .87 
ItO 199 467 175 183 agi Abaixo de 191 100 
Altura (comatinotros) 
Fig. 2-2 


Para algumas finalidades prefere-se considerar a distribuição da 
frequência acumulada de todos os valores superiores ou iguais ao 
limite inferior de cada intervalo de classe. Como se consideram, 
nesse caso, as alturas de 150,5 em ou mais, de 158,5 cm ou mais, ete., 
essa distribuição é, às vêzes, denominada distribuição acumulada “acima 
de”, enquanto que a anterior é designada por distribuição acumulado 
“abaixo. de.. Uma. é. facilmente deduzida da outra (veja Probl: 15). 
As ogivas correspondentes são denominadas decrescentes e crescentes. 
Sempre que se fizer referência a distribuições acumuladas, ou ogivas, 
sem nenhuma qualificação, entender-se-á que elas correspondem ao 
tipo “abaixo de”. 


Distribuições de fregiiência acumulada relativa. ÓOgivas per- 
centuais 


A jregüência acumulada relativa ou percentual é a freqüência 
acumulada dividida pela total. Por exemplo, a frequência acumulada 
relativa das alturas abaixo de 174,5 em é 65/100 = 65%, o que significa 
que 65% dos estudantes têm alturas inferiores a 174,5 cm. Se, na 
Tabela 22 e na Fig. 2-2, fóssem utilizadas fregiiências acumuladas 
relativas, em vez das próprias acumuladas, os resultados seriam 
denominados distribuições de fregiúência acumulada relativa ou per- 
centual c polígono de fregiiência acumulada relativa ou ogivas percen- 
tuais, respectivamente. 
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Curvas de freqüência. Ogivas regulares 


Os dados coletados podem, usualmente, ser considerados como 
pertencentes a uma amostra extraída de grande população. Como 
se dispõe de muitas observações da população, é teôricamente possível 
(para dados contínuos) 'a escolha de intervalos de classe muito pegue- 
nos e ter, até, números convenientes de observações que se situam 
dentro de cada classe. Assim, seria possível contar com um polígono 
de freguência ou de frequência relativa para uma grande população 
que tenha tantos pequenos segmentos de linha quebrada que se 
aproximem bastante de uma curva que será denominada curva de 
tregiiência ou de freguêncio relativa, respectivamente, 

É razoável esperar que se possa aproximar dessas curvas teóri- 


“cas, mediante a regularização dos polígonos de fregiiência ou de 


freguência relativa de uma amostra, tornando-se maior a apro- 
ximação à medida que aumenta o volume da amostra. Por esta, 
razão, a curva de fregiiência é muitas vêzes denominada polígono 
de frequência regularizado. $ 

De maneira semelhante, obtém-se ogivas regularizadas mediante 
a regularização dos polígonos de frequência acumulada ou ogivas. 
Comumente é mais fácil regularizar uma ogiva do que um polígono 
de frequência (veja Probl.. 18). 


Tipos de curvas de fregiiência 


Curvas de fregiiência aparecem, na prática, sob diversas formas 
características, como as indicadas na Fig. 2-3, 


(a) Curvas de frequência simétrica ou em forma de sino. Caracte- 
rizam-se pelo fato das observações eqitdistantes do ponto central 
máximo terem a mesma frequência. 

Um exemplo importante é a curva normal. 


(b) Nas curvas de freguência moderadamente assimétrica ou des~ 
viadas, a cauda da curva de um lado da ordenada máxima é mais 
longa do que do outro. Se o ramo mais alongado fica à direita, a 
curva é dita desviada pare a direita, ou de assimetria positiva, enquan- 
to que, se ocorre o inverso, diz-se que a curva é desviada para a es- 
querda ou de assimetria negativa. 


(co) Na curva em forma de J, ou em J invertido, o ponto de orde- 
nada máxima ocorre em uma das extremidades. 
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(d) Uma curva de frequência em jorma de U tem ordenadas 
máximas em ambas as extremidades. 


(e) Uma curva de frequência bimodal tem dois máximos. 


G) Uma curva de fregiência multimodal tem mais de dois má- 
ximos. 


sas AN L- 
Simótrica ou om forma do sino Dosviada pora o diroita Dosviada pora 3 esquordo 
{assimetria positiva ) (oasimetria nogativa) 
Em farmo do 4 Era forras do 3 imvartião Em forma do U 
Bimodal Multimodal 
Fig. 2-5 


Problemas Resolvidos 


Rol 


l. (a) Dispor os números 17, 45, 38, 27, 6, 48, 11, 57, 34, 22 
em um rol. (b) Determinar a amplitude total. 


Solução: 


(4) Em ordem crescente de grandeza o rol é: 6, 11, 17, 22, 27, 34, 38, 45, 48, 57. 

Em ordem decrescente de grandeza o rol é: 57, 48, 45, 38, 34, 27, 22, 17, 11, 6. 

(b) Visto que o menor número é 6 e o maior é 57, a amplitude “total é 
57 — 6 = 5L 
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3. Os graus finais de matemática de 80 estudantes da Univer- 


“* sidade do Estado estão relacionados na tabela abaixo. 


os 84 75 82 68 90 62 88 76 93 
73 79 88 73 60 93 71 59 85 75 
61 65 75 87 Ts 62 95 78 63 72 
86 78 82 75 94 77 69 74 68 60 
96 78 89 61 75 95 60 79 83 7L 
79 62 67 97 78 85 76 65 a 75 
65 80 73 57 88 78 62 76 53 74 
86 67 73 8 72 63 76 75 85 vyd 


Com referência a essa tabela, determinar: 

(a) o maior grau; 

(b) o menor grau; 

(c) a amplitude total; 

(d) os graus dos cinco estudantes mais adiantados; 

(e) os graus dos cinco estudantes mais atrasados; 

(f) o grau do estudante classificado em 10º lugar; 

(9) quantos estudantes receberam grau igual ou superior a 75 

(h) quantos estudantes receberam grau abaixo de 85; 

(i) qual a percentagem dos estudantes que receberam graus 
entre 65 e 85, inclusive; 

(j) quais os graus que não apareceram. 


Solução: 


Algumas destas questões são tão detalhadas que para respondê-las da melhor 
maneira, constrói-se primeiramente o rol. Isto pode ser obtido subdividindo-se 
os dados em classes convenientes e colocando-se cada número da tabela na classe 
apropriada, como foi feito na Tabela 2.3, abaixo, denominada tabela de simples 
entrada. Ordenando-se os números dentro de cada classe, como está indicado 
na Tabela 2.4, obtém-se o 'rol desejado. 


Tabela 2.3 


50 — 54| 53 

55 — 59 | 59, 57 

60 — 64 62, 60, 61, 62, 63, 60, 61, 60, 62, 62, 63 

85 — 69 | 68, 68, 65, 66, 69, 68, 67, 65, 65, 67 

70— 74] 73, 73, TU 74, 72, 74, T1, 7L, 73, 74, 73, 72 

75 — 79 | 75, 76, 79, 75, 75, 78, 78, 75, T7, T8, 75, 79, 79, 78, 76, 75, 78, 76, 76, 75, 77 
80 — 84 | 84, 82, 82, 83, 80, 81 

85 — 89 | 88, 88, 85, 87, 89, 85, 88, 86, 85 

90 — 94 | 90, 93, 93, 94 

95 — 99 95, 96, 95, 97 
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Tabela 2.4 

50—54 | 53 

55—59 | 57,59 


60-64 | 60,60, 60, 61, 61, 62, 62, 62, 62, 63, 63 

65 -— 69 | 65,65, 65, 68; 67, 67, 68, 68, 68, 69 

70—74 | 71,714, 71, 72 72, 73, 73, 73, 73, T4, 74, T4 

75—79 | 75,75,75, 75, 75, 75, 75,76, 76, 76, 76, 77, 77, 78, 78, 78, 78, 78, 79,79,79 
80 —84 | 80, 81, 82, 82, 83, 84 

85 — 89 85, 85, 85, 86, 87, 88, 88, 88, 89 

90 — 94 | 90, 93, 93, 94 

95—99 | 95, 95, 96, 97 


Em vista da Tabela 2.4, é relativamente fácil responder às questões acima. 
Assim 

(a) o maior grau é 97; 

(b) o menor grau é 53; 

(e) a amplitude total é 97 — 53 = 44; 

(d) os cinco estudantes mais adiantados obtiveram os graus: 97, 96, 95, 95, 94; 

(e) os cinco estudantes mais atrasados obtiveram os graus: 53, 57, 59, 60, 60; 

(J) o grau do estudante classificado em 10º lugar é 88; 

(9) o número de estudantes que receberam graus iguais ou superiores & 75 
é 44; 

(h) o Húmicio de estudantes que receberam graus álibi de 85 é 63; 

(i) a percentagem de estudantes que receberam graus êntre 65 e 85, inclusi- 
ve, é de 49/80 = 61,2%; 

(G) -os graus que não apareceram foram de O.a 52,.54,.55, 56, 58, 64, 70, 91, 


92, 98, 99, 100, 


Distribuições de frequência, histogiamas e polígonos de fre- 
guência 

3. A Tabela 2.5 mostra a distribuição de frequência dos salários 
semanais, em cruzeiros, de 65 empregados da Companhia P & R. 


Com referência a essa tabela, Tabela 2.5 
eterminar: ` 
determina? Salários Número de 
(cruzeiros) empregados 


(a) O limite inferior da sexta classe. 
Resp.: Cr$ 10000. 


(b) O limite superior da quarta classe. oa ns Esso io 
Resp.: Cr$ 8 999. 7000 — 7999 16 
(c) O ponto médio da terceira classe, ` Soo Z ARE o 
O ponto médio-da terceira classe = 10900 — 10 999 5 
= 1/2 (Cr$ 7 000 + Cr 7 099) = 13 000 — 11999 2 

= Cr$ 7 499. E 
Total 65 


Para fins práticos, axredonda-se para Cr$ 7 500. 
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(d) Os limites reais da quinta classe. 

Limite real inferior da quinta classe = 1/2 (Cr$ 9000 + Cr$ 8 999) = 
= Cr$ 8 999. 

Limite real superior da quinta classe = 1/2 (Cr$ 9 999 + Cr$ 10000) = 
= Cr$9 999. 

(e) Amplitude do quinto intervalo de classe. 

Amplitude do quinto intervalo de classe = limite real superior da 5.º classe 
— limite real inferior da 5.º clásse = Cr$ 9 999 — Cr8 8999 = Cr$ 1 000. 

Neste caso, todos os intervalos de classe têm a mesma amplitude: Cr$ 1 000. 

QU) A fregiiência da terceira classe. 

Resp.: 16. 

(9) A frequência relativa da terceira classe. 

Resp.: 16/05 = 0,240 = 24,6% 

(h) O intervalo do classe que tem a maior fregiiência, 

Resp.: Cr$ 7 000 — Cr$ 7 999. 

Isso é fregiientemente denominado intervalo de classe modal. Sua fregiiência 
é, então, denominada freguência de classe modal. 

(©) A percentagem de empregados que ganbam menos de Cr$ 8 000 por se. 
mana. O número total de empregados que ganham menos de Cr3 8 000 por so- 
mana é igual a 16+10+8= 34. 

A percentagem de empregados que ganham menos de Cr$ 8 000 por semana = 
= 34/65 = 52,39%. 

(j) A percentagem de empregados que ganham menos de Cr$ 10000 e 


-- pelomenos “Cr$-6:000-por semana: -~ =- Lug deem at ia mapa time ct e 


Número de empregados que ganham menos de Cr$ 10 000 mas, pelo menos, 
Cr$ 6000. por semana = 10 + 14 + 16 + 10 = 50. 

Percentagem de empregados que ganham menos de Cr$ 10000 mas pelo 
menos, Cr$ 6 000 por semana = 50/65 = 76,9%. 
. 4. Se os pontos médios de uma distribuição de freqüência dos 
pesos de estudantes são 64, 68,5, 73, 77,5, 82, 80,5 e 91 quilos, deter- 
minar: (a) a amplitude do intervalo de classe; (b)'os limites reais 
de classe; (c) os limites de classe, admitindo-se que os pesos foram 
determinados com precisão até meio quilo. 


Solução: 


(a) Amplitude do intervalo de classse = diferença comum entro doje pontos 
médios sucessivos = 68,5 — 64 = 73 — 68,5 = ete. = 4,5 kg. 

(b) Como os intervalos de classe têm a mesma amplitude, “os limites reais 
de classe dividem ao meio a distância entre os pontos médios e, portanto, têm os 
valores 


4 (64 + 68,5), 3 (6 e 5.5 + 9) ou 
DO 255 TOTO aai 88.75 kg. 
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O primeiro limite real de classe é 66,25 — 45 = 61,75 e o último é 38,73 + 
+ 4,5 = 93,25, porque & amplitude do intervalo de classe é constante e igual a 
4,5 kg. Assim, todos os limites reais de classe são dados por: 

61,75; 66,25; 70,75; 75,25; 79,75; 84,25; 88,75; 93,25 kg. 

(c) Como os limites de classe são da ordera de meio quilo, serão escolhidos 
os valores 62, 66, 68,5, 70,5, 71, 75 ... para os limites resis das' classes. 

Então, os limites da 3.º classe serão 62 — 66; os da seguinte serão 66,5 — 70,5, 
ete. 

5. Representar gràticamente os resultados do problema pre- 
cedente. 


Solução t 


462 b665 105p 
i) -i Ji 
+ 
[Ta | cs bi 
1 N, 


n 75,755 793,80 RA gp 84.5 8A.3n, 89 93 l 
T e H A rs ma 
Do bl ns Ha bl ns Bl o dk 
i ; | f 


i 
6175 66.25 775 75,25 79,73 8425 88.75 93.23 


Os pontos médios 64, 68,5; 73 ... 91 estão locados sôbre o eixo dos A 

Os limites reais das classes estão indicados peles linhas verticais longas, 
tracejadas, e O limite das classes pelas cheias. aa 

6. A menor de 150 medidas é 5,18 polegadas è a maior 7,44 
polegadas: Determinar um conjunto conveniente de; (o) intervalos 
de classe; (b) limites reais de classe; (c) pontos médios que poden 
ser usados na formação de uma distribuição de freqüência dessas 
medidas. i 

Solução: f 

A amplitude total é 7,44 — 5,18 = 2,26 polegadas. Para um mínimo de-5 
intervalos de classe, & amplitude do intervalo seria 2,26/5 = 0,45, aproximada- 
mente, e para o máximo de 20, 2 amplitude do intervalo de classe seria, e 
= 0,11, aproximadamente. As preferências convenientes para a amplitude o 
intervalo de classe estarão situadas entre 0,11 e 0,45 e poderiam ser 0,20, 9,30 
ou 0,40. s 

(a) Nas colunas X, TI e IT estão indicados os intervalos de classe apropriados 
que têm amplitudes de 0,20, 0,30 e 0,40, respectivamente. 


1 Ei m 

5,10 5,10 — 5,39 5,10 — 5,49 
330 5,40 — 5,69 5,50 — 5,89 
5,50 57 580 — 6,29 
5,70 80 6,30 — 6,69' 
5,90 83 670 — 7,09 
6,10 68 710 — 749 - 
6,30 89 . 
5,50 TA 
6.70 

H 


ng 
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Note-se que o limite inferior de cada primeira classe poderia ser diferente 


. de 5,10. Por exemplo, se a coluna I tivesse início em 5,15, como limite inferior 


do primeiro intervalo de classe, poder-se-ia ter escrito 5,15 — 5,94. 
(b) Os limites reais de classe correspondentes às colunas F, Il e III de (a) 
são dados, respectivamente, por: 
I 5,095 — 5,295, 5,205 — 5,495, 5,495 — 5,695, ..., 7,205 -— 7,495 
II 5,095 — 5,395, 5,395 — 5,695, 5,695 — 5,995, ..., 7,195 — 7,495 
NI 5,095 — 5,495, 5,495 — 5,795, 5,795 — 6,095, ..., 7,095 — 7,495 


Note-se que êstes limites reais de classe são convenientes porque não podem 
coincidir com as medidas observadas. 

(0) Os pontos médios correspondentes às colunas I, I e HI de (a) são dados 
respectivamente, por 

I — 5,195, 5,395, ..., 7,395 IL — 5,245, 5,545, ..., 7,945 II — 5,295, 
5,695, ..., 7,295. 

Êstes pontos médios oferecem a desvantagem de não coincidirem com as 
medidas observadas. 


7. Ao responder ao problema precedente, um estudante esco- 
lheu os intervalos de classe 5,10 — 5,40, 5,40 -= 5,70, ... 6,00 — 7,20, 
7,20—7,50. Há alguma coisa errada com esta escolha ? 


Solução: 


Esses intervalos de classe se superpõem em 5,40, 5,70, ..., 7,20. Assim, 
uma medida registrada com o valor 5,40, por exemplo, poderia. ser lançada em 
qualquer dos dois primeiros intervalos de classe, Alguns estatísticos justificam 
essa escolha, pela possibilidade de lançar-se a metade dêsses casos ambíguos em 
uma classe e metade na outra. 


Essa ambigiidade é removida mediante a adoção de intervalos de classe como 
5,10 — até 5,40, 5,40 — até 5,70, ete. Neste caso, os limites de classe coincidem 
com os limites reais e os pontos médios podem coincidir com os dados observados. 


Em geral, é preferível evitar a superposição de intervalos de classe, sempre 
que fôr possível, e escolhê-los de modo que os limites reais sejam valores que não 
coincidem com os dados realmente observados. Por exemplo, os intervalos de 
classe para o problema anterior poderiam ter sido escolhidos como 5,095 — 5,395, 
5,395 — 5,695 ete., sem margem à ambiguidade. Uma desvantagem desta es- 
colha particular é que os pontos médios não coincidem com os dados observados. 


8. Na tabela seguinte estão relacionados os pesos de quarenta 
estudantes do sexo masculino da Universidade Estadual, arredon- 
dados para: meio quilo. Construir a distribuição de frequência. 


69 82 75 66 72 625 | 745) 785 
73 79 70 73,5 | 68 7% 76 72 
8i e | 69 88 815 | 595) 77 825 
73 | 365 | 7L (8 | 95) msj 70 67.5 
30,5 7235 | 675) 7 75 78 725| 64 
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Solução: 

O maior pêso é 88 quilos e o menor 59,5; portanto, a amplitude total é igual 
a 28,5 quilos. 

Se forem adotados 5 intervalos de classe, 2 amplitude dêsses intervalos será 
'28,5/5 = 6, aproximadamente. 

Se forem adotados 20 intervalos de classe, sua amplitude será igua a 
28,5/20 = 2, aproximadamente. 


Uma escolha conveniente para a amplitude do intervalo de classe será 25 kg. 
Também, é conveniente escolher os pontos médios 60, 62,5, 65, 67,5, ... quilos. 


Então, podem ser tomados os intervalos de classe 59 — 61, 61,5 — 63,5, 604-—66,.... 


Com essas escolhas, os limites reais de classe serão 58, 75, 61,25, 63,75, ... que 
não coincidem com os valores dos dados observados, i 


A distribuição de frequência pedida é apresentada na Tabela 2.6. A coluna 
do centro, chamada marcação ou mapa de apuração, é usada para tabular as fre- 
qiências das classes dos dados brutos e é comumente omitida na apresentação 
final da. distribuição de frequência. Não é necessário fazer-se um rol, embora 
seja vantajoso seu emprêgo na tabulação de frequências. 


Tabela 2.6 
Pêso (kg) Marcação Fregiiência 
59 — 61 / 1 
61,5 — 63,5 7) 2 
64 — 66 H 2 
66,5 — 68,5 mm 4 
6 —7d TAL I 6 
71,5 — 73,5 HA H 8 
74 — 76 PHL 5 
76,5 — 78,5 ii 4 
7. — 8 IA 2 
81,5 — 83,5 HH 3 
84 — 86 / 1 
86,5 — 88,5 1 2 
i 
Total 40 


Outro método: 


Naturalmente, há outras distribuições de fregiiências. A Tabela 2.7, por 
exemplo, mostra uma distribuição de fregiiência com 7 classes sômente, cujo in- 
tervalo é igual a 45 kg ' 


aÃ rima iii 
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Tabela 2.7 


E 
Pêso (kg) | Marcação. Fregiiência *” 
h i 
59 — 63 É 4 
63,5 — 67,5 PH 5 
68 — 72 PL Hili 9 
72,5 — 78,5 PEL THL 1 12 
77 — 8L | Hu. | 5 
81,5 — 85,5 t 
86 — 90 | e 2 
t 
jr 
Total 49 


9. Construir: (e) um histograma c (4) um polígono de fre- 
quência para a distribuição de pesos do Probl. 8. 
Solução: 


O histograma e o poligono de frequência para cada um dos casos considerados 
no Probl. 8, estão representados nas Figs. 2d4(a) © 2-4(b). 


Frequência 


Fregiêgeso 


feio ERR Ex 
963 610 63,5 70,0 74.5 79,0 835 880 92,5 
Pêro (lg) 


Fig. 2-4) 


Note-se que os meios das bases dos retângulos estão localizados nos pontos 
médios. 

10. Com os dados do Probl. 3 construir: (a) uma distribuição 
de frogiiência relativa ou percentual; (b) um histograma; (ce) um 
histograma. de frequência relativa; (d) um polígono de frequência; 
(e) um polígono de frequência relativa. 


Solução: 

(a) À distribuição de fregúência relativa, apresentada na Tabela 2.8, 6 de- 
duzida da distribuição de frequência do Probi. 3, mediante a divisão de cada fre- 
qüêncis de classe pelo total das frequências (65), exprimindo-se os resultados em 
percentagens. 
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Tabela 2.8 
Salários Fregiiência relativa 
(cruzeiros) (em percentagem) 
5000 — 5999 12,3 
4000 — 6999 15,4 
7000 — 7999 24,6 
8000 — 8999 21,5 
f 9000 — 9999 15,4 
Fo 10 000 — 10999 7,7 
Po 13 000 — 11999 31 
E Total 100,0% 


(b) e (e) O histograma e o histograma de freqiiência relativa estão apresentados 
na Fig. 2-5, Note-se que, para transformar um histograma em outro de fre- 
qüência relativa, é necessário apenas adicionar ao histograma uma escala vertical 


que indique as, fregiiências relativas, como a que está representada à direita. 
(d) e (e) O polígono de fregitência e 


to $E ode freqüência relativa estão represen- 
lu É È tados pelos gráficoñ em linhas tracoja- 
g É das, na Fig. 2-5. Em conseguência, para 
É E transformar um polígono de frequência em 
Ê Ë outro de freqüência relativa, precisa-se 
sòmente adicionar ume eseala vertical 
élirtos (kev erea 5) que indique as freqüências relativas. 


Fig. 2-5 

se fòsse desejado apenas um polígono de frequência relativa, 
ao lado não conteria o histograme c o eixo das freqüências 
sentado à esquerda, em vez do eixo de fr cia. E 


por exemy 


31. Provar que a área total dos retângulos de um histograma 
limitada pelo polígono de freqüência correspondente e pelo 


é igual à 
eixo dos 


Solução: 


A demonstração será feita para o ca- 
so de um histograma constituído de três 
retângulos, como está indicado 20 lado, e 
q polígono de fregiiência correspondente, 
representado em linhas tracejadas, Fig. 2-6 


Área total do retângulo = área sombreada + área IL + área IV + área V + 
ároa VIL = área sombreade + área I + área ILI + árca VI + área VIII = área 
' total limitada pelo polígono de iregiiência e o ciso dos X. 
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Portanto, Área 1 = área II, área IU = área IV, área V = área VI c área 
VII = área VII. 


12. Na Companhia P & R (Probl. 3), cinco novos empregados 
foram contratados com os salários semanais de Cr$ 8 534, Cr$ 11 683, 
Cr$ 13 578, Cr$ 15621 e Cr$ 17450. Construir uma distribuição 
de freqüência dos salários dos 70 empregados. 


Solução: j 

As distribuições de freqüência possíveis estão apresentadas nas Tabelas 
(0), WU) (0) e (d) 

Em (a), foi mantida a mesma amplitude de intervalo de classe; Cr$ 1000, 
em tôda a tabela. Como resultado, há demasiadas classes vazias èe os detalhes 
são excessivamente escassos na parte superior da escala de salários. 

Em (b), as classes vazias e os detalhes escassos foram evitados, mediante 
o emprêgo do intervalo aberto “Cr$ 12000, ou mais”, A desvantagem disso é 
que a tabela se torna inaplicável à realização de certos cálculos matemáticos. 
Por exemplo, é impossível a determinação do total de salários pagos por semana, 
visto que “mais de Cr$ 12 000” pode implicar, possivelmente, que haja indivíduos 
que ganhem tanto quanto Cr$ 12000 por semana. 

Em (c), foi adotada uma amplitude do intervalo de classe igual a (8 2000. 
Uma desvantagem é que desaparecem muitas informações referentes à parte infe- 
rior da escala de salários c que os detalhes são ainda escassos na parte superior dela, 

Em (d), foram empregadas amplitudes de intervalo de classe desiguais. Uma 
desvantagem é que certos cálculos matemáticos, que serão feitos mais tarde, 
perdem a simplicidade com que poderiam ser efetuados quando os intervalos de 
classe têm a mesma amplitude. Também, quanto maior fôr a amplitude do 
intervalo de classe, tanto maior será o êrro de agrupamento. 


a: : (b) 
Salários reniiânai Salários ET AE 
(cruzeiros) Fregiiência (cruzeiros) Fregiiência 
5000 — 5999 8 5000 — 5999 8 
6000 — 6999 10 6000 — 6999 10- 
7000 — 7999 16 7000 — 7999 16 
8000 — 8999 15 8000 — . 8 999 15 
9000 — 9999 10 9000 — 9999 10 
10 000 — 10 999 5 10 000 — 10999 5 
11000 — 11999 3 11000 — 11 099 3 
12000 — 12999 0 12000 où mais 3 
13 000 — 13 999 1 J 
14000 — 14999 0 
15000 — 15 999 1 T 
16 000 — 16 909 0 SPER 
17 000 — 17 999 i 
m 
Total 70 
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©) (a) 


Salários (cruzeiros) | Freglência Salários (cruzeiros) | Fregiiência | 


5000 — 6999 18 5000 — 5999 8 
7000 — 8999 31 6000 — 6999 10 
9000 — 10999 15 7000 — 7999 16 
11000 — 12.999 3 8000 — 8999 15 
13 000 — 14 999 1 9000 — 9999 10 
15 000 — 16 999 1 10000 — 11999 8 
17 000 — 18 999 1 12000 — 17 999 3 
Totea, 70 


Total 70 


13. Construir um histograma para a distribuição de frequência 
` da Tabela (d) do Probl. 12. 


Solução: 


Froguêncio 


4 P 
Š E 
& á 


16500 
17500: 
18500 


Salários (em eruzelros) 


Fig. 2-7 


O histograma pedido está representado na Fig. 2-7. Para ruiu, utiliza-se 
a propriedade de serem as áreas proporcionais às freqüênci Suponha-se que 
o retângulo A corresponde à 1.º classe (veja Tabela (d) do Probl, 12) com fregú 
iguala 8 Visto que a sexta classe da Tabele (d) tembém - 
classe igual a 8, o retângulo B que representa esta classe deverá ter área igual à 
de 4. Então, como B tem o dôbro da largura de À deverá ter a metade de sua 
altura, como foi representado. 


Semelhantemente, o retângulo C, que representa s classe G» Tabela 


(d), tem altura igual à metade da unidade da escale veriical. 
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Distribuições de fregiiência acumulada e ogivas 


l4. Construir: (a) uma distribuição de fregiiência acumulada; 
(b) uma distribuição acumulada percentual; (c) uma ogiva; (d) uma 
ogiva percentual da distribuição de frequência do Probl. 3. 


Solução: 
(ae b) A distribuição de frequência acumulada e a percentual (ou dis- 
tribuição de frequência acumulada relativa) estão combinadas na Tabela 2.9. 


Observe-se que o valor de cada casa da coluna 2 é obtido adiciogando-se 
sucessivamente os das casas da coluna 2 da tabela do Probl, 3. Então, 18 = 8 + 
+10, 34 = 8 + 10 + 16, ete. 


Tabela 2.9 
Salários Freqüência Fregtisnoia 
(cruzeiros) acumulada percentual a” 
di AGE dis 
Abaixo de 5 000 0 0,0 
Abaixo de $ 000 8 12,3 
Abaixo de ` 7 000 18 27,7 
Abaixo de & 000 34 52,3 
Abaixo de 9 000 . 48 73,8 
Abaixo de 10 000 58 89,2 
Abaixo de 11 000 Ed Mi i a cnisgB pe 
Abaixo de 12 000 65 100,0 
ha a a y 


O valor de cada casa da coluna 3 é deduzido do da anterior, mediante sua 
divisão por 65, que.é a frequência total, exprimindo-se os resultados om percen- 
tagens. Então, 34/65 = 52,3%. Os valores desta coluna podem ser obtidos, 
também, adicionando-se sucessivamente 08 valores das cases da coluna 2 da tabela: 
o Probl. 10(a). Assim, 27,7 = 12,3 + 15,4, 52,8 = 12,3 + 15,4 + 24,6, ete. 


(e) e (d). A ogiva (ou polígono de fre- 3 
qüência acumulada) e a ogiva percen- 4% wA 
tual (ou polígono de frequência relativa É x E 
acumulada) estão ambas representadas E E 
na Fig. 2-8. A escala vertical da esquer- $ > “é 
da permite a leitura da frequência acumu- $ a i E 
lada, enquanto que a da direita indica * 17 e: 
a fregúência acumulada percentual. č 


soou. 


g 
& 


600i 
7000: 
Duon 
10000. 
12000. 


O que foi exposto atima refere-se 
a distribuições de frequência acumulada tolários tom crusatres) 
“abaixo de” e a ogivas, por causa do Mo- 


do como as fregiiências foram acumuladas. Fig. 2-8 
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15, Construir (a) uma distribuição de freqüência acumulada, 
“acima de” e (b) uma ogiva da mesma natureza, para a distribuição 
de frequência do Probl. 3. 

(b) 


Solução: 


(a) Observe-se que o valor de ca- 
da casa da coluna 2 da Tabela 2.10 
é obtido adicionando-se sucessivamen- 
te os de cada casa da coluna 2 da 
Tabela, 2.5 do Probl. 3, a partir do 
fim daquela tabela. Assim, 7 = 2 + 
+5, 17 = 2+5 -+ 10, cte. 
£ HEE s E Eisses valores podem também ser 
bi Ea obtidos subtraindo-se, da frequência 
Salários (om «ruzolros) É total, 65, cada valor da coluna 2 
da Tabela 2.9 do Probl. 14. Assim, 
57 = 65 — 8, 47 = 65 — 18, ete. 


” Frequência Acumulada 


acima de 


Fig. 2-9 


Tabela 210 
caem mm mm 


Salários (cruzeiros) Fregiiência acumulada 


“acima de” 


Acima de - 5 000 65 
Acima de 6 000 57 
Acima de 7 000 47 
Acima de 8 000 31 
Acima de 9 000 17 
Acima de 10 000 T 
Acima de 11 000 2 
Acima de 12 000 0 


16. Deduzir, das ogivas no Probl. 14 ou 15, o número de 
empregados que recebem (a) menos de Cr$ 8 800 por semana; (bY 
Org 9600 ou mais por semana; (c) Cr$ 6300 no mínimo e menos 
de Cr$ 7500 por semana. 


Solução: 


(a) Na ogiva “abaixo de” do Probl. 14, traça-se uma linha vertical que in- 
tercepta o eixo dos “salários” no ponto correspondente a Cr$ 8800. Essa linha 
corta a ogiva no ponto de coordenada (88, 45); portanto, 45 empregados recebem 


menos de Cr$ 8 800 por semana. 

(è) Na ogiva “acima de” do Probl. 15, traça-se uma linha vertical no ponto 
correspondente a Cr$ 9600, Essa linha corta a ogiva no ponto (96, 11); então, 
11 empregados recebem Cr$ 9600 ou mais. 
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Isto também pode ser deduzido de uma ogiva “acima de”, Mediante a 
- construção de uma linha vertical no ponto correspondente a Cr$ 9 600 verifica-se 
que 54 empregados ganham menos de Cr$ 9600; portanto, 65 — 54 = 11 empre- 
gados recebem Cr$ 9600 ou mais. 
(c) Usando a ogiva “abaixo de” do Probl. 14, tem-se: 
Número pedido de empregados = 


= número dos que recebem menos de Cr$ 7 500 — 


— número dos que recebem menos de Cr3 6300 = 26 — 11 = 15. 


Note-se que os resultados acima poderiam, igualmente, ser obtidos pelo pro- 
cesso de interpolação na tabela de fregúências acumuladas. Por exemplo, na 
parte (a), visto que Cr$ 8 800 está a 8/10 ou 4/5 da distância entre 80 e 90, o nú- 
mero de empregados pedido está situado a 4/5 da distância entre os valores cor- 
respondentes a 34 e 48 (veja tabela do Probl. 14). Mas, 4/5 da distância entre 
34 e 48 é 4/5 (48 — 34) = 11. Então, o número pedido de empregados é 
34 + Il = 45. 


17. Cinco moedas foram lançadas 1 000 vêzes e, em cada, lance, 
foi anotado o número de car Os números de lances nos quais 
foram obtidas 0, 1, 2, 3, 4 e 5 caras estão indicados na Tabela 2.11. 


Tabela 2.11 (a) Representar graficamente 


os dados; (b) construir uma ta- 


Número 


de oaei o de ni bela que apresente as percenta- 
gens dos lances que resultaram em 
0 88 números de caras menores do que 
E ao 0,1,2,3,4,5 ou 6; (c) represen- 
3 287 tar gràficamente os dados da ta- 
4 104 ofar 
5 3 bela referida em (b). 
Solução: 

Total 1 000 (a) Os dados podem ser representa- 


dos graficamente de um dos modos indi- 
cados nas Pigs. 2-10 e 2-11, 


A Fig. 2-10 parece ser o gráfico de emprêgo mais natural, visto que, por exem- 
plo, o número de caras não pode ser 1,5 ou 3,2. Ésse é um gráfico de barras cuja, 
largura é igual a zero e é, às vêzes, denominado gráfico em bastão. É usado espe- 
cialmente quando os dados são discretos. 


A Fig. 2-11 apresenta um histograma dos dados. Note-se que a área total 
do histograma é igual à freqüĉncia total 1 000, como seria de esperar. Ao utilizar 
a representação histogrâmica ou o polígono de fregiiência correspondente, tratam-se 
essencialmente os dados como se fôssem contíntios. Isso será útil futuramente, 
Note-se que já foram utilizados anteriormente o histograma e o polígono de fre- 
Qüência para dados discretos, no Probl. 10. 
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EA (c) O gráfico pedido pode sor representado por qualquer um dos da Fig. 2-12 
se E * ou da Fig. 2-13. 
Ê dx a 30 A Fig. 2-12 é a mais-apropriada para representar dados discretos visto que, 
2 E o 
PECE ã » por exemplo, a percentagem de lances nos quais há menos de duas caras é igual 
2 ago go, à daqueles em que haverá menos de 1,75, 1,56 0u 1,23 caras, de modo que a mesma 
É Ro Bote percentagem, 18,2%, poderia ser indicada para êstes valores (indicada pela linha 
Fia 5" horizontal). 
so 
o ú A Fig. 2-13 representa o polígono de frequência acumulada, ou ogiva, para 
r Br Ao E os dados, e os trata essencialmente o se fôssem contínuos. 
Número de coros Número de caras fo 
Note-se que as Pigs. 2-12 e 2-13 correspondem, respectivamente, às Figs. 2-10 
Fig. 2-10 Fig. 2-11 e 2-11 da parte (á). 
ei ; (b) Com referência à Tabela 2.12 pedida, note-se que ela representa simples- i * Curvas de fregiiência e cgives regui 
É mente uma, distribuição de frequência acumulada, e um percentual dos Btmeros 18. Os 100 estudantes do sexo masculino da Universidade XYZ 
i de caras, Deve-se observar que os valores “menos de 1”, “menos de 2”, ete., i % de 43 tit ente n daa 1546 d e 
poderiam ter sido, semelhantemente, “menos de ou igual a 0”, “menos de ou igual j {veja pág. & ) constituem rea mese ma, MIMO 008) 0 eta 
Universidade. Com os dados contidos na amostra: 


e r, ete. 
` (a) Construir um polígono regularizado de frequência percentual 


(curva de fregiiência). 


E Número Percentual (b) Construir uma ogiva regular percentual “abaixo de”. 
EA R Número de Lances de Lances Ns š , Gears ; 
no Número de Caras | (roniiência acumulada) | (fregiência acumulada (e) Deduzir des resultados de (o) é (©), o número de estudan- 
E percentual) tes da Universidade que têm alturas entre 145 cm e 178 cm. Quais 
E , ; as hipóteses que podem ser ai j 
“menos de 0” 0 é ão sen E “CN BL É es P e PR PER Esse 
nenos de 1 38 38 pe (d) Podem ser utilizados B avaliar ar propor 
menos de 2 182 18,2 ção de homens, nos Estados altura entre 165 em 
menos de 3 524 52,4 $ 178 > 7 
menos de 4 8il Str Ea e tio em: 
menos de 5 975 97, j PA 
menos de 6 1000 109,0 i Solução: . . i 
il | (a) e (b). Nas Figs. 2-14 e 2- ados representam os poh- 
Cs - à gonos de fregiiência e as ogivas e que aparecem nas páginas 
i 46 a 48, respectivamente. O í tados em linha 
PA Ra i cheia), são dêles deduzidos, por żpr E by forna de curvas regulares, 
fa 
T — p” iz” 
É É éra 
ge 7 s$ 
E mem a EA 
È E fe” 
É a Bs É E 
$ o B a ese ag 
E 2d 
É ao $ m j 
E, | oe 
ed T sido) T T K T Rê T T 
º i 2 3 + 5 è b $ 2 3 a 5 8 H . 
Número do caras Nómero do caras À Na prática 6 mais fácil + obtém-se 
: a x A primeira e ogiva r s regulari- 
ji Fig. 2-12 Fig. 233 n i zado é obtido medinnte a le 
| 
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(c) Se a amostra de 100 estadantes é representativa da população de 1546 
estudantes, «8 curvas regulares dos itens (a) ¢ (b) podem ser admitidas como sendo 
a curva de frequência percentual e a ogiva percentual dessa população. A hipó- 


100 
80 
-80 


4o 


Fregliência Acumulada 
(am porcentagem ) 


204 


+ + 
151, 159 167 175 183 194 
Akura (em centimetros) 


Fig. 2-15 


tese será correta apenas quando a amostra fôr aleatória, isto é, quando cada es- 
tadante tiver a mesma oportunidade, como qualquer outro, de ser escolhido para 
integrar a amostra. 


Como as alturas entre 165 em o 178 em, registradas em centímetros, repre- 
sentam realmente alturas compreendidas entre 164,5 cm e 178,5 em, a percentagem 
de estuuantes da população que têm essas alturas pode ser determinada dividindo-se 
a área sumbreada da Fig. 2-14 pela total limitada pela curva regular e o eixo dos X. 


É mais simples, entretanto, o emprêgo da Fig. 2-15, na qual se vê que: 


porcentagem de estudantes de alturas menores do que 178,5 em = 82% 
percentagem de estudantes de alturas menores do que 164,5 cm = 18% 


portanto, a percentagem de estudantes de alturas compreendidas entre 164,5 em 
e 178,5 em = 82% — 18% = 64%. Então, o número de estudantes da Univer- 
sidado que têm alturas compreendidas entre 165 em e 178 em, aproximadas para 
cm, é iguala 64% de 1546 = 089. 


Outro modo de expor êsse fato consiste em dizer que a probabilidade ou chance * 


de uma pessoa, selecionada ao acaso entre os 1546 estudantes, ter altura compreen- 
dida entre 165 cm e 178 em é de 64%, 0,64 ou 6t em 100. Por causa da relação 
de probabilidade (considerada no Capítulo 6, as curvas de fregiiência relativa são 
às vêzes denominadas curvas ou distribuições de probabilidade, 


(d) Poder-se-is considerar a proporção pedida como sendo 64% (com muito 
mais incerteza do que antes), apenas quando houvesse a convicção de que a amostra 
de 100 estudantes, tirada da população total masculina dos Estados Unidos, re- 
presentasse verdadeiramente uma amostra aleatória. Contudo, isso é um tanto 
improvável por várias razões, tais como: (1) alguns dos estudantes do colégio 
podem não ter alcançado suas alturas máximas; (2) a geração de jovens tenderá a 
ser mais alta do que seus ascendentes. 
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Problemas Suplementares 


19. (a) Dispor em um rol os números 12, 56, 42, 21, 5, 18,10, 3, 61, 34, 65, 42. 
(b) Determinar a amplitude total. 

Resp.: (b) 62. 

20. A Tabela 2.13 apresenta uma dis 
400 válvulas de rádio, ensaiadas na L & M T 
essa tabela determinar: 


de freqgüências da duração de 


Compu Com referência a 


(a) o limite superior da quinta cla; Tabela 2.13 


(b) o limite inferior da oitava cla: 


(e) o ponto médio da sétima cla, Dia cao ici) Número 

(d) o limite real de classe da última s de válvulas 
classe; 

(e) amplitude de intervalo de classe; ao, ss sm A 

(9) à freqüĉncia da quarta classo; 500 — 599 58 

(9) a frequência relativa da sexta classe; o e ea Es 

(h) a percentagem das válvulas cuja du- am A 899 62 
ração não excede a 600 horas; 900 — o o 

(i) a percentagem das válvulas de dura- i Em Es y o 8 
ção maior do que ou igual a 900 horas; fr O lima er EE 

(j) a percentagem das válvulas, cuja Total 400 


duração é de 500 horas, no mínimo, mas 
inferior a 1 000 horas. 

Resp.: (a) 799; (b) 1 000; (e) 949,5; (d) 1 099,5, 1 199,5; (e) 100 horas; 0) 76; 
(9) 62/400 = 0,155 ou 15,5%; (h) 29,5%; (1) 19%; (3) 18%. 

21. Construir: (a) um histograma e (b) um polígono de fregiiência correspon- 
dente à distribuição de fregitência do problema precedente. 

22. Para os dados do Probl, 20, construir: (a) uma distribuição de frequência. 
percentual ou relativa; (b) um histograma de fregiência relativa; (e) um polígono . 
de frequência. relativa. : 

23. Com os dados do Probl. 20, construir: (4) uma distribuição de fregiên- 
cia acumulada; (b) uma distribuição acumulada percentual ou relativa; (6) uma 
ogiva; (d) uma ogiva percentual, (Note-se que, a não ser que haja especifi- 
cação em contrário, a distribuição refere-se à construída na base de “abaixo de”). 


24. Resolver o problema precedente, quando as frequências são acumuladas 
na base de “acima de”. ú 

25. Avaliar a percentagem das válvulas do Probl. 20, de duração: (4) menor 
do que 560 horas; (b) de 970 ou mais horas; (c) compreendida entre 620 è 890 horas. 

Resp: (a) 24%; WY 11%; (e) 46%. 


26. Os diâmetros internos das arruclas 
ser medidos com arredondamento cm mi 
da distribuição de fregūüência dêsses diâme 


mroduzidas por uma companhia, podem 
polegadas. Se os pontos médios 
3 são dados, em polegadas, por 0,321. 
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0,324, 0,327, 0,330, 0,333 e 0,336, determinar: (a) a amplitude do intervalo de classe 


(b) os limites reais de classe; (0) os limites de classe. 

Resp.: (a) 0,003 polegadas; (b) 0,3195, 0,3225, 0,3255, ..., 0,3375 polegadas; 
(e) 0,320 — 0,322, 0,323 — 0,325, 0,326 — 0,328, . . ., 0,335 — 0,337. 

27. A tabela seguinte relaciona os diâmetros, em polegadas, de uma amostra, 
de 60 rolamentos de esferas produzidos por uma companhia. Construir a dis- 
tribuição dos diâmetros, usando intervalos dé classe convenientes. 

0,738 0,729 0,743 0,740 0,736 0,741 0,735 0,731 0,726 0,737 
0,728 0,737 0,736 0,735 0,724 0,733 0,742 0,736 0,739 0,735 
0,745 0,730 0,742 0,740 0,728 0,738 0,725 0,733 0,734 0,732 ` 
0,733 0,730 0,732 0,730 0,739 0,734 0,738 0,739 0,727 0,735 
0,735 0,732 0,735 0,727 0,734 0,732 0,736 0,741 0,736 0,744 
0,732 0,737 0,731 0,746 0,735 0,735 0,729 0,734 0,730 0,740 

28. Com os dados do problema precedente, construir: (a) um histograma; 
(b) um polígono de freqüência; (c) uma distribuição de frequência relativa; (d) 
um histograma de frequência relativa; (e) um polígono de frequência relativa; 
(f) uma distribuição de fregiiência acumulada; (g) ums distribuição acumulada 
percentual; (h) uma ogiva; (1) uma ogiva percentual. 

29. Deduzir, dos resultados do Probl. 28, a percentagem de rolamentos 
de esferas, cujos diâmetros; (a) excedem 0,732 polegadas; (b) não são superiores a 
0,736 polegadas; (c) estão compreendidos entre 0,730 e 0,738 polegadas. Com- 
parar os resultados com os obtidos diretamente dos dados brutos do Probl. 27. i 

30. Resolver.o Probi. 28 com os dados do Probl. 20. 

“81. À Tabela 2-14 relaciona a distribuição percentual- da renda total per- 
cebida em 1956, nos Estados Unidos, pelos homens de 14 anos ou mais. 

Usando esse tabela, responder às seguintes perguntas: 


(a) Qual éo comprimento ou amplitude do 
segundo intervalo de classe? E do sétimo? 

(b) Quantas amplitudes de classe diferentes 
existem? 

(c) Quantos intervalos de classe abertos 
existem ? 


Tabela 2.14. 


Percent. 
de 
homens 


Renda (dólares) 


= Menos de 1 000 1 

(d) Como poderia ser escrito o primeiro in- 1000 — 1 999 11,7 

tervalo de classe, de modo que sua amplitude 2 ooo SA a E o 
paços us PR ` ? 3 — 3 999 

fôsse igual à do segundo? 4000 — 4 999 159 

(e) Qual o ponto médio do segundo interva- 5 000 — 5 999 11,9 

lo de classe? E qual a do sétimo? 6 000 — 9 999 12,7 
O 000 ou mais 


(Q) Quais são os limites reais de classe do 


uarto intervalo de classe ? : 
T : Fonte: Bureau oj the Census. 


(9) Qual a percentagem de homens que 
ganham US$ 4 000 ou mais? E menos de USS 3 000? 

(h) Qual a percentagem de homens que ganham USS 3 000, no mínimo, 
e menos de US$ 5 000? 


veremos 
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(d Qual a percentagem de homens que ganham salários entre USS 3 300 
«e US$ 6300? Que hipóteses são formuladas para êsse cálculo? 

(5) Por que o total das percentagens não é igual a 100%? 

Resp.: (a) US$ 1000, USS 4 000; (b) quatro (se bem que, rigorosamente fa- 
iandô, a última classe não tenha amplitude especificada); (c) uma (se bem que a 
primeira classe parece ser um intervalo de classe aberto, ela realmente substitui 
0 — USS 999,99); (d) 0 — USS 999; (e) USS 1 499,50; USS 7 499,50; para a 
“maioria das finalidades práticas podem ser adotados US$ 1 500, e UBS 7 500, 
respectivamente; (j) US$ 2 999,50 e USS 3 999,50; (g) 44,1%, 41%; (h) 30,7%; (3) 
42%; (5) por causa dos erros arredondados no cáteulo das percentagens. 

32. (a) Por que é impossível construir um histograma percentual ou poli- 
gono de frequência para a distribuição do problema precedente? (b) Como se 
modificaria a distribuição, para que pudessem ser construídos um histograma, 
percentual e um polígono de freguência? (c) Fazer a construção, utilizando-se 
a modificação indicada no item (b). 

33. (a) Construir um polígono regularizado de fregiiência percentual e a 
ogiva regular percentual correspondentes aos dados do Probl. 20. 

(b) Deduzir, dos resultados obtidos em (a), à probabilidade de uma válvula 
queimar-se antes de 600 horas. . 

(c) Discutir o risco ou a chance que o fabricante assume ao garantir que uma 
válvula, durará, pelo menos, 425 horas? E 875 horas? 

(d) Se o fabricante oferece garantia de 90 dias por uma válvula, ou a devo- 
lução do dinheiro, qual é a sua probabilidade, de efetuar o reembôlso, admitin- 
do-se que a válvula é usada 4 horas por dia? 8 horas por dia? 

“Resp: (0) 0,30; (d) 0,008 0,820 meme 

34. (a) Lançar quatro moedas cingiienta vêzes e registrar o número de caras 
em cada lance. (b) Construir uma distribuição de frequência que mostre o número 
de lances em que aparecem .0, 1, 2, 3, 4, caras. (c) Construir uma distribuição 
percentual correspondente ao item (b). (d) Comparar a percentagem obtida em 
(c) com as teóricas, 6,25%, 25%, 37,5%, 25%, 6,25% (proporcionais a 1, 4, 6, 4 
e 1) determinadas pelas leis de probabilidade. (e) Construir a representação grá- 
fica das distribuições dos itens (b) e (e). (J) Construir uma ogiva percentual, com 
os dados obtidos. 

35, Resolver o problema precedente para mais de 50 lances de 4 moedas e 
verificar se a experiência é mais concordante com a expectativa teórica. Senão, 
indicar as possíveis razões das diferenças. 


Caríruto 3 


MÉDIA, MEDIANA, MODA E 
OUTRAS MEDIDAS DA TENDÊNCIA CENTRAL 


Rr m PA 
Índices ou notação por índices 


O símbolo X; (leia “X índice j”) representa qualquer um dos - 


N valores, Xi, Xo, Xas.. ., Xy, assumidos pela variável X. A letra 
j, em X;, que pode representar qualquer dos números 1, 2, 3, ... N, 


é denominada índice. Evidentemente, pode ser usada qualquer 


outra letra além dej, como 2, k, p es. 


Notação de somatório 


N 
O símbolo pa X; é usado para representar a soma de todos os 
jE 
X; desde j = laté j = N, i. e., por definição, 
x 
E X=X + X+X + + Xp 
se 
Quando não há possibilidade de confusão indica-se, frequente- 
mente, aquela soma, de modo mais simples, por Z X, Z X; ou EX. 


(0 símbolo 2 é a letra grega maiúscula sigma, que indica soma. 


N 
Exemplo 1. 2, XiYj = XP + XY + XP +... + XyYy. 
ja 


CAP. 3 MÉDIA, MEDIANA, MODA E OUTRAS a 


N 
Exeraplo 2. 2, aXj =aXı +aXko +... HaXy = BM... + 


j= 


N 
+Xy) = aÈ X;, em que a é uma constante. Mais simplesmente, 20X = cBX. 
je k 


Exemplo 3. Se a, b, c são constantes quaisquer, Z(aX + bY — cZ) = 
= EX +bEY — DZ (veja o Probl. 3). 


Médias e medidas da tendência central 


A média é um valor típico ou representativo de um conjunto 
de dados. Como êsses valores típicos tendem a se localizar em 
um ponto central, dentro de um conjunto de dados ordenados se- 
gundo suas grandezas, as médias também são denominadas medi- 
das da tendência central. 


Vários tipos de médias podem ser definidos, sendo as mais. 
comuns a média aritmética ou, abreviadamente, a média, a mediana, 
a moda, a média geométrica e a média harmônica, Cada uma delas 
apresenta vantagens e desvantagens, dependendo dos dados e dos 
fins desejados. 


Média aritmética 


A média aritmética, ou média, de um conjunto de N nú- 
meros Xn Xs, X; ..., Xw é representada por X (leia-se “X barra”) 
e definida por 


ga ttt o +Xy (EX EX, a) 
N 5 N 
Exemplo: A média aritmética dos números 8, 3, 5, 12; 10 é: 
Fa SH3+5 + +IO | 38 ga, 
5 5 

Se os números Xi, Xa Xo, ..., Xg ocorrerem fu Jo Joc fK 
vêzes, respectivamente (i. e., ocorrerem com as freqüências fu fe 
Ja} -~o fg) à média aritmética será: 
po fi Io tht tfr ZA EX, D 

fiethth t-tir Zj N 


onde N = Èj é a freiriiência total, i. e., o total do número de casos. 
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Exemplo: Se 5, 8, 6, 2 ocorrerem com as frequências 3, 2, 4, e 1, respectiva- 
mente, a média aritmética será: 


Şa G5) + CXS) + AO) + (DA) n 15 +16 +U+2 57 
3+2+4+1 10 SA 


Média aritmética ponderada 


Ās. vêzes, associam-se os números Xu X», ..., Xg a certos 
Jatôres de ponderação ou pesos wi, Wz ..., Wg que dependem do 
significado ou importância atribuída aos números. Nesse caso 

ge WB WX: +... Hwg  BuX à 3 

wi +w: +... + wK Zw (8) 

tem a denominação de média aritmética ponderada. Note-se sua se- 

* melhança com (2), que pode ser considerada uma média aritmética 
ponderada, com os pesos fy fa ..., Jr 


Exemplo: Se o exame final, em um curso, tem pêso 3e as provas correntes 
pêso 1, e um estudante tem grau 85 naquele exame e 70'e 90 nas provas, seu 
grau médio é: i 


F = STO) + (190) + (3X85) 415 os 
1+1+3 5 i 


Propriedades da média aritmética 


(a) A soma algébrica dos desvios de um conjunto de números, 
em relação à média aritmética, é zero. 

E Exemplo: Os desvios dos números 8, 3, 5, 12, 10, em relação à sua média 
aritmética 7,6, são: 8 — 7,63 7,6, 5— 7,6, 12 — 7,6, 10 — 7,6 ou 0,4; — 
— 46, — 2,6, 4,4, 2,4 com soma algébrica igual a: 0,4 — 46 — 26 + 44 + 
+ 24 = 0. i 

(6) A soma dos quadrados dos desvios de um conjunto de nú- 
meros Xy em relação a qualquer número a, é um mínimo quando 
q = X e sômente neste caso (veja o Probl. 27, Capítulo 4). 


(c) Se fi números têm média mı, jz números tém média 
Mo... fg números têm média mx, a média de todos os números é 


= tm + fm +... + Jame A (4) 
hth+...+iz 


i. e, a média aritmética ponderada de tôdas as médias (veja o 
Probl. 12). 
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(d) Se 4 é qualquer média aritmética admitida ou arbitrada (que 
pode ser qualquer número), e se d; = X; — 4 são os desvios de X; 
em relação a À, então as equações (1) e (2) tornam-se, respectiva- 
mente, 


M 
PR eg RAA 6) 
B No” N? 
5 
= du Jili a 
Zaat ns B, (6) 
dt; 
j=l 


K 

em que N = È, J; = Èj. Note-se que (5) e (6) são resumidas nas 
j=l 

equações X = 4 +d (veja o Probl. 18). 


Cálculo da média aritmética para dados agrupados 


Quando: os dados são apresentados em uma distribuição de 
frequência, todos os valores incluídos num certo intervalo de classe 
são considerados coincidentes com o ponto médio do intervalo. 


As fórmulas (2) e (6) 'sérão válidas para êsses dados agrupados” sreski 


quando se interpretar X; como o ponto médio, f; como a frequência 
de classe correspondente, 4 comò qualquer ponto médio admitido 
ou arbitrado e d; = X; — A como o desvio de X,, em relação a A. 

Os métodos de cálculo que empregam as fórmulas (2) e (6) são, 
às vêzes, denominados processo longo e abreviado (desvio em valores), 
respectivamente (veja os Probls. 15 e 20). 

Se todos os intervalos de classe têm a mesma amplitude c, 
todos os desvios d; = X; — A podem ser expressos como cu, 
podendo u; ser números inteiros positivos ou negativos, ou zero, 
ie 06+1,42,483,...,6 a fórmula (6) torna-se: 


X=4+ o 


que é equivalente à equação X = A +e- Ñ (vejaoProbl2i). 
Chama-se a isto processo abreviado (desvio em classes) para o cálculo 
da média. É um método muito rápido e deveria ser usado sempre 
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para os dados agrupados, quando as amplitudes de intervalo de classe 
forem iguais (veja os Probls. 22 e 23), Note-se que, no processo abre- 
viado (desvios em classes), os valores da variável X são transfor- 
mados nos valores da variável u, segundo a relação X =A+teu. 


A mediana 

A mediana de um conjunto de números, ordenados em ordem 
de grandeza (i. e., em um rol), é o valor médio ou a média aritmética 
dos dois valores centrais. 


Exemplo 1. O conjunto dos números 3, 4, 4, 5, 6, 8, 8, 8, 10 tem mediana 6. 
Exemplo 2. O conjunto dos números 5, 5, 7, 9, 11, 12, 15, 18 tem mediana 


(9 + 11) = 10. 


Para os dados agrupados, a mediana, obtida por interpolação, 
é dada pela fórmula: 


N 
2 pes (Zi) 


Í mediana 


Mediana = Dı + c . (8) 


em que: 

Lı = limite inferior real da classe mediana (i. e., da classe que 
contém a mediana); 

N = número de itens dos dados (i. e, fregiência total); 

(Èf) = soma de tôdas as fregiiências das classes inferiores à 
mediana; 

Jinediana = frequência da: classe mediana; 

c = amplitude do intervalo da classe mediana. 

GeomêBtricamente, a mediana é o valor de X (abscissa) cor- 
respondente à vertical que divide o histograma em duas partes de 
áreas iguais. Esse valor de X é, às vêzes, representado por Ž. 


A moda 


A moda de um conjunto de números é o-valor que ocorre com 
a maior freqiiência, à. e., é o valor mais comum. A moda pode não 
existir e, mesmo que exista, pode não ser única. 

Exemplo 1. O conjunto 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 18 tem moda 9. 

Exemplo 2. o conjunto 3, 5, 8, 10, 12, 15, 16 não tem moda. E 

Exemplo 3. O conjunto 2, 3, 4, 4, 4, 5, 5, 7,7, 7, 9 tem duas modas, 4 e 7, € 
é denominado bimodal. 
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Uma distribuição que tem apenas uma única moda é denomi- 
-nada unimodal. 

No caso de dados agrupados para os quais foi construída uma 
curva de freqüência que a êles se ajuste, a moda. será o valor (ou 
valores) de X correspondente ao ponto de ordenada máxima (ou 
pontos) da curva. Êste valor é, algumas vêzes, representado por X. 

Para uma distribuição de frequência ou histograma a moda 
pode ser obtida por meio da fórmula: 


Z As ) 
Moda = Li + (x FA, J” (9) 


em que: 

L, = limite real inferior da classe modal (i. e., a que contém 
a moda); ý 

A, = excesso da freqüência modal sôbre a da classe imedia- 
tamente inferior; : a 

A, = excesso da fregiiência modal sôbre a da classe imedia- 
tamente superior; 

c = amplitude do intervalo da classe modal. 


Relação empírica entre a média, a mediana e a moda 


Para as curvas de frequência unimodal moderadamente desvia- 

das (assimétricas), vigora a relação empírica 
Média — Moda = 3 (Média — Mediana). (10) 
Nas Figs. 3-1 e 3-2, abaixo, aparecem as posições relativas 
da média, da mediana e da moda para curvas de fregiência desviadas 
para a direita e para a esquerda, respectivamente, Para curvas 
simétricas, a média, a moda e a mediana são tôdas coincidentes. 


Média 
Mediana 
moda! 


Moda 
Mediana 
Média 


Fig. 3-1 Fig. 3-2 
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A média geométrica G 


A média geométrica G de um Sonjunto de N números Xu Xi, 


Xs... Xy é a raiz de ordem N do produto dêsses números: 
© GEVERM Xh. a1) 


Exemplo: A média geométrica dos números 2, 4, e 8 6: 
G= V CMB) = Vo = 4. 
Na prática, G é calculado por meio de logaritmos (veja o Probl. 


35). Para a média geométrica de dados agrupados, veja os Probls. 
36 e 91. 


A média harmônica H 


A média harmônica H de um conjunto de N números Xu Xe, 


Ay, Xy é a reciproca da média aritmética das recíprocas dos 
ametos 
H=- PER e -= e 
1 
NÃ 2X (12) 


Na Prásioa, é mais fácil lembrar que: 


PE 18 
H N TNX 0a 
Exemplo: A média harmônica dos números 2, 4 e 86 
H =: 3 =3 =3,48. 
lrlsIo o 
$ 2 4 8 8 


Para a média harmônica de dados agrupados, veja os Probls. 
99 e 100. 


Relação entre as médias aritmética, geométrica e harmônica 


A média geométrica de um conjunto de números positivos 
Xi Xe, ..., Xy é menor do que ou igual à sua média aritmética, 
mas é maior do que ou igual à'sua média harmônica. Em símbolos: 

H<gs X. (4) 


O sinal de igualdade vale sômente quando todos os números 
Ni Xa, ..., Xy são idênticos. 
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' Exemplo: O conjunto 2, 4 e 8 tem média aritmética 4,67, média geom 6 
«Arica 4 e média harmônica 3,43. 


A raiz média quadrática (R.M.Q.) 


A raiz média quadrática (R.M.Q.) ou média quadrática, de 
um conjunto de números X1, X» ..., Xw é, algumas vêzes, repre” 


sentada por VÝ e definida por: 


RM.Q. = VĒ = Will = a5) 


Esse tipo de média é usado freqüentemente nas aplicações da 
física. ` 


Exemplo: A R.M.Q. do conjunto de números 1, 3, 4, 5, e 7 é: 


MEETETETET = VD = 447. 


5 ' 


-Quartis, decis e percentis 

Se um conjunto de dados é fics em , ordem de rag 
o valor médio (ou média aritmética dos dois valores médios) que di- 
vide o conjunto em duas partes iguais é a mediana. Por extensão 
dêsse conceito, pode-se pensar nos valores que dividem o conjunto 
em quatro partes iguais. Êsses valores, representados por Qu Qz 
e Qs denominam-se primeiro, segundo e terceiro quartis, respectiva- 


mente, sendo o valor Q: igual à mediana. 


Semelhantemente, os valores que dividem os dados em dez partes 
iguais denominam-se decis e são representados por Di, Do, ..., Do 
enquanto que os valores que dividem os dados em 100 partes iguais 
chamam-se percentis e são representados por Pi, Pa, ...,Poo. O quinto 


decil e o giinquagésimo percentil correspondem à mediana. O 25.º 
e o 75.° percentis correspondem ao 1.º e 3.º quartis; respectivamente. 


“De maneira geral, os quartis, decis e percentis e outros valores 
obtidos mediante subdivisões dos dados em partes iguais-são deno- 
minados quartis. Para deduzilos dos dados agrupados, veja os 
Probls. 44 a 46. 
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Problemas Resolvidos 
Notação de somatório 
l. Desenvolver os têrmos de cada uma das seguintes somas 


indicadas: 


a A 
(0). È X Xı + Xa + X + Xi + X + Xe. 


j=l 


4 
(è) 2% = 3) (Yi = 3)? + (Y2 = 3$ + (Ps — 3} + (Y4 — 3}. 
ja ` 


N 
() Za atota+r.. +a= Na 
jm 


$ 
(a) eia HXi +X + faXs + JaXa + IX 


3 € 
(e) = (Xi — a) + (X2 — a) + (X; — a) = X + X2 + Xs — 3a. 


2. Indicar, por meio da notação de somatório, cada uma das 
expressões seguintes: 


2 
(0) MEX AX. XR Ear 
3 
(b) (Xr+ Y) +(X: + Yi +... +(Xa + Ya) 2 (X; + Y3). 
; je 
Dos 
O hX, HRX, + oo So Kg Pia 
N 
(d) abi + ab + als + ...tandy È abi. 
j= 
4 
(e) AMP + JaXaYo + JXaYa + fsXaYa È pX; 


N N N A 
3. Provar que 2, (0%; + bY; — c2) =a 5 x, +55 Y; 
jai ja 5; 


N 
EE a &; em que a, b, e e são quaisquer constantes. 
j= 
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x 
RA (aX; + bY; — cZ) = (aX; + bYi — c21) + (@Xs + bY — eZ) F... + 
ja 


+ (aXn +bFy ~ cZn) = 
= (aX, + aXi +... + aXn) +Y, bra +. + 
+bYn) — (Zi +e +... +cZn) = ` 
= +X: +... AXN) HAY t Yt + 

+ YN) — dA + Z: +... + ŽN) = 


N N N 
=a X Xj+b D Yj;-c © Zj 
je ‘jal jm 
ou, resumidamente, (aX + bY — cZ) = a2X +5EY — ckZ. 


4. Duas variáveis, X e Y, assumem os valores X, = 2,X, = — 5, 
X=4Kk=-8eY=-—-3,P 8, Y, = 10,Y; = 6, respec- 


tivamente. Calcular: (a) EX; (b) ZY; (ù EXY; (d) 2X3; (e) 2Y? 


Q) (EX) (ZY); (9) EXP; M) ZX + YXX — Y). 


Solução: 


Note-se que, em cada caso, foi omitido o índice j de X e Ye que Z 
E E í 
significa E. 
jai 


4 
Então, LX, por exemplo, é abreviação de 2 X; 
É e 


(a) EX=D+HU-D+HMD+H(-B=2-5+4-8=—7 

o EY = (— 3) -+ (— 8) -+ (10) + (6) = — 3—8 -+10 +6=5 

() ZXY = (2) (— 3) + (—5) (~ 8) -+ (4) (10) + (~ 8) (6) = — 6 + 40 + 
+40 — 48 = 26 { 

(d) EX = (2 + (= 5) + (4F + (— 8} = 4 +25 +16 +64 = 109 

(e) EY? = (—3} +(— 8} + (10} + (6) = 9 +64 -+100 +36 = 209 

O) (EX)EY) = (—7) (5) = —35, usando (a) e (b). Observa-se que 


l (2X) (EY) = È XY. 


(@ EXP = (2) (— 3% + (— 5) (~ 8} + (4) 10} + {~ 8) (6 = —190 
6) B(X +Y) — Y) = 2X — Y?) = 2X? — EY? = 109 — 209 = 
= — 100, usando (d)e (e). . 


8 so 
5. Se LX; =—4€ 25 = 10, calcular: (a) = (2X; + 3); 
i= ja 


jai 


®© Ex, -= 3; (0) Z (E — 5}. 
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Solução: 
8 6 K kd 
(a) RA (2x; +3 = Ras +23 = 22, X; + (6X8) = 2(— 4) +18 = 10 
5 6 6 6 . 
© 2GA- = E 0G-X)= 2X EX=10-(-4)=14 


6 8 6 6 
(0) BM 5P = (X$ — 10X; + 25) = 2% -= 10 2 X; +25 (6) = 
p ja 


; 


= 10 — 10 (— 4) + 25 (6) = 200. 


8 
Se fôr desejado, pode-se omitir o fúdice je usar È em vez de $, quando 
e j.i 
essas abreviações forem comprèensíveis, 


A média aritmética 


6. -Os graús de um estudante em seis exames foram 84, 91, 72, 
68, 87 e 78. Determinar a média aritmética dos graus. 


Solução: 


Fa ZX SELO +72 +68 ABTH (480 go, 

N 6 6 : 
Fregiientemente, use-se o têrmo média como sinônimo de média aritmética. 
Estritamente falando, entretanto, isto é incorreto porque há outras médias além 

“da aritaégica. i ca 

7. Dez medidas do diâmetro de um cilindro foram anotadas 
por um cientista como 3,88, 4,09, 3,92, 3,97, 4,02, 3,95, 4,03, 3,92, 
3,98, e 4,06 polegadas. Determinar a média aritmética das medidas. 


, Solução: 
Fo EX L 8/88+4,09+3,02+8,07-+4,021+3,95 +4,03-13,02+3,08+4,06 _ 
N 10 
= dao = 3,98 polegadas. 


8. Os salários mensais de quatro homens são: Cr$ 15 000, 
Cr$ 18 000, Cr$ 19 500 e Cr$ 99 000. (a) Determinar a média 
aritmética de seus salários. (b) Poder-se-ia dizer que essa média 
é típica dos salários? g 


Solução: 


NES 18.000 + 18.000 + 19 500 + 90000, n 142.300 = 35 625 


(admitindo-se que todos os slgarismosg são significativos nos salários relacionados). 
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(b) A média Cr 35 625, certamente, não é típica dos salários, e apresentar 


a ésse valor como salário médio, sem nenhum comentário ulterior, seria cometer 


êrro grosseiro. 

Uma grande desvantagem da média é que ela é fortemente afetada pelos 
valores extremos. 

9. Determinar a média aritmética dos números 5, 3, 6, 5, 4, 
5,2,8,6,5,4,8,3,4,5,4,8,2,5e 4. 


1.º maétodo: 


F ZX 1 t3H6+5+45+248+6 4544184844 4548 y, 
No 20 
24544 96 4 

+ 2 = 8 

2º método: ; 

Há seis 5, dois 3, dois 6, cinco 4, dois 2 e três 8. Então: , 

Fo EX ZIX, (6X6) + (2X3) + (D6) + OXD + (202) + (OB) n 
py) N 6+2+24+5+2+3 


96 
2O 48. 
20 


10. Entre 100 números, vinte são 4, quarenta são 5, trinta são 
6 e os rèstantes são 7. Determinar a média aritmética dos números. 


Solução: 


Şa- Ž/X ZIX — (CONS) + (40X6) + (30X6) + (10X7) | 530. 5.30. 
Èj N 100 109 º 


11. Os graus finais de um estudante, em Matemática, Física, 
Inglês e Higiene são, respectivamente, 82, 86, 90 e 70. Se os pesos 
atribuídos a essas matérias são, respectivamente, 3, 5, 3.€ 1, deter 
minar o grau médio. r 


Solução r 


Emprege-se a média sritmética ponderada, sendo o. fator de ponderação a 
associar a cada grau o pêso atribuído a cada matéria. Então: 


= A3XB2). + (5X86) + (3X90) + A70) gs 
Zw 3+5 +3 +1 


12. Em uma companhia que tem 80 operários, 60 recebem 
Cr$ 69, e 20 Cr$ 40, por hora. 


(a) Determinar o salário médio por hora. (b) O resultado seria 


F= Z wX 


-o mesmo do item (o), se 60 empregados tivessem salário flutuante 
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com o médio de Cr$ 60, por hora e 20, nas mesmas condições, rece- 
bessem, em média, Cr$ 40, por hora? Demonstrar essa resposta. 
(c) Pode-se crer que a média do salário-hora flutuante é típica ? 


Solução: 


a (60XCr3 60) + (20)(Cr$ 40) ` _ Cr$ 4 400 
60 + 20 80 
(b) Sim, o resultado é o mesmo. Para demonstrá-lo, admita-se que fı nú- 
meros tenhara a média mı e jp tenham a média mz. Pode-se mostrar que a média 
de tòdos os números é: 


(a) X= = Cr$ 55. 


ZIX 
N 


Z = im dt fama, 
hth 
Seja M a soma dos fı números e Mz & dois f} Então, pela definição da 
média aritmética, 
= Mı = My 
E PE a 
ou Mi = jume Mo = Jem. Como a soma de todos os (fı + fa) números é (Afi + 
-+ Ma) a média aritmética de todos êles é: 
Şa Mtd Jm + fm 
hth hth 
como se queria provar. O resultado é facilmente generalizado. 


(c) Pode-se dizer que Cr$ 55, é um salário-hora “típico”, no sentido de 
que a maior parte dos empregados recebe Cr$.60, por hora, o que não está 
muito afastado de Cr$ 55, por hora. Deve-se recordar que, sempre que se 
resumem dados-numéricos em um valor único (como é o caso da média), está-se 
sujeito a cometer algum êrro. Certamente, entretanto, êste resultado não está 
tão errado como o do. Probl. 8. 


Resimente, para se estar bem seguro, deve-se fazer uma avaliação da “ex- 


tensão” ou da “variação” dos dados em relação à média (ou a outras médias). ` 


Chama-se a isso dispersão dos dados. Várias dessas medidas aparecem no Capi- 
tulo 4. è 

13. Quatro grupos de estudantes, constituídos de 15, 20, 10 e 
18 indivíduos têm pesos médios de 81, 74, 77 e 70 kg, respectiva- 
mente. Determinar o pêso médio de todos os estudantes. 


Solução: 
z BIX _ (5X81) + (2074) + (10X77) + (18X70) ud 
Fe = nega 

Zj. 15 +20 + 10-+ 18 ae quilos: 


34. Se ds rendimentos médios anuais dos trabalhadores agrico- 
las e não-agrícolas, nos Estados Unidos, são, respectivamente, 3 500 
dólares e 4 500 dólares, pode o rendimento médio anual de ambos os 
grupos ser de 4000 dólares? 


cap. 3 MÉDIA, MEDIANA, MODA E OUTRAS 83 


Solução: 

i Seria de 4 000 dólares sômente se o número de trabalhadores agrícolas e 
não-agrícolas fôsse o mesmo. Para determinar o rendimento médio anual ver- 
dadeiro, seria necessário conhecer o número de trabalhadores de cado grupo. 
Se, por exemplo, houvesse um trabalhador agrícola para 11 nio-agrícolas, & 
média seria: i 

z = (X88500) + (1S4 500). $ 4 400 
1+1 
arredondado pera 100 dólares. Essa é uma média aritmética ponderada. 


15. Usar a distribuição de frequência das alturas da tabela 
da pág. 43 para determinar a média das alturas de 100 estudantes 
do sexo masculino da Universidade XYZ. 


Solução: 


O trabalho está delineado na Tabela 3.1. Note-se que todos os estudantes 
que têm alturas entre 151 e 158 cm, 159 e 166 em etc., são considerados como 
medindo 154,5, 162,5 em etc., de altura. O problema reduz-se, então, em deter- 
minar a altura média dos 100 estudantes, 5 dos quais têm 154,5 cm de altura, 18 
têm 162,5 cm, etc. 


Tabela 3.1 


Alturas (cm) Ponto Médio (X) | Frequência (f) IX 
151 — 158 154,5 5 712,5 
159 — 166 162,5 18 2 925,0 
167 — 174 170,5 42 7 164,0 
175 — 182 178,5 27 4 819,5 
183 -— 190 186,5 8 1 492,0 
N=Ef=100 | JX = 17 170,0 


Os cálculos necessários podem tornar-se enfadonhos, especialmente nos casos 
de números grandes, quando houver muitas classes. Dispõe-se de técnicas 
abreviadas para diminuir o trabalho nesses casos. Veja os Probls. 20 o 22, 
por exemplo, 


Propriedades da média aritmética 


16. Provar que a soma dos desvios de Xi, Xa, ...y Am, em re, 
lação à sua média aritmética X, é igual a zeto. 
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Solução: 


Sejam dı = X, — X, da = X — X, :. dy = Xy — Eos desvios de Xi, 
Xo ..., Xy em relação à sua média X. 
Então: 


e o 5x; 
soma dos desvios = Ed; = Z(X; — X) = ZX; — NX = EX; — N (22) io 
= EX; — EX; = 0. 
X a 
Nessas rolações, afotou-se E em lugar de 2 Poder-se-ia, se fôsse desejado, 
PES 


omitir o índice j de Xj, porque os têrmos continuariam compreensíveis. 
17. Se Zi = Xı + Yu Za = X: + Yo Zy = Xu + Ym 
provar que Z = X + Yo 


Solução: 
W D D = BY 7. 2Z PAS 
Por definição, X = T Y = EA Z= Era Então 
A -ZED = ŁZY ZX 2Y L} 
aS a e NO No ii 


N 
Foram omitidos os índices j de X, Y é Z,e Z significa PA : 


fa) Se N números Xi Xz... Xy têm desvios, em rela- 


ae a um número, 4, dados, respectivamente, por dı = Š; — Á, 


dz = Xi — Á, ady = Xy — 4, provar que 
N 
X=A+ E “Ap Sê 
AS N N 
(b) No caso de Xi, Xa ..., Xx terem, respectivamente, fre- 
quência Jı Ju -o fx e di = X— Á, ..., dg = Xx— 4, demonstrar 
que o resultado de (a) será substituído por 
x 
Do Sidi | K 
X = 4+ 5 sA ZI, sondo À h=Èj=N 
j=l 


X-A e Xj= d+ dz então: r 
a MA ta) BA + Edy NA +Ed pas Èd 
N N N N 
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N 
a  ådotou-se E em vez de 2o para abreviar. 
je 


2º -método: 


Temse d=X-Aoquk=A RE d, omitindo os índices de de de X. Então, 
pelo ‘Probl. 17, 
X=4pd=4+ z 


porque a média de um certo número de constantes, tôdas iguais a 4, é d. 


O X= a a EX. ERA LO) 2 ESf A Elis o 
N N N 


a ABA Zli AN + Djl a q Bi aap Bla 
N No: + No. e 
Note-se que, formalmente, ésse resultado é deduzido de (a) mediante a subs- 
tituição de d; por Jjd; e a realização. da soma de j = 1 até K, em vez de j = 1 até 
N. O resultado é equivalente a X = A +d, em que d = (Ejd/N. 


Cálculos da média aritmética dos dados agrupados 


19. Usar o método do Probl. 18(a) para determinar a média 
aritmética dos números 5, 8,11, 9/1276, 14 10, escolhendo-pararc =: 
“média arbitrada” A os valores (a) 9 e (b) 20. 


Solução: 


(a) Os desvios, em relação a 9, dos números dados são: — å, — 1,2,0,3, ~ 
— 3,5 è 1 e a soma dos desvios é Èd = — 4 — 1+2 +0 +33 +5 +153 
Então: 


Zå 3 
Feártlogy 3 m 0,375 
+ K + 3 ,375. 
{b} Os desvios, em relação a 20, dos números dados, são: — 15, — 12,— 9, — 
—11, — 8, — 14, -6, — 10;2d = — 85. Então: 
Z=A+ z = 20 + ca = 9,375. 


“20, Usar o método do Probl. 18(b) para determinar a média 
aritmética dos 100 estudantes do sexo masculino da Universidade 
XYZ (veja Probl. 15). 

Solução: 


A operação pode ser disposta como na Tabela 3.2. Toma-se para média 
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Tabela 3.2 

Ponto Médio X | Desvio d = X — A | Fregiiência (f) | jd 
154,5 — 16 5 — 80 

. 162,5 - 8 18 — 144 

A —> 170,5 0 42 o 
178,5 8 27 216 

186,5 16 8 128 
N=D/=100 | Dj =120 


arbitrada A o ponto médio 170,5, da classe de maior fregiiência, embora possa 
ser adotado qualquer outro. Note-se que os cálculos São mais simples do que 
os do Probl. 15. Para diminuir ainda mais o trabalho, pode-se proceder como 
no Probi. 22, em que se lançou mão da propriedade dos desvios (coluna 2 da 
tabela) serem todos múltiplos inteiros da amplitude do intervalo de classe. 


že Bil o 70,5 4 120 x = 
X= AF V 170,5 100 170,5 + 1,2 = 171,7 em. 
21. Seja dj = Xj — A o desvio, em relação a um dado ponto 
médio A, de qualquer ponto médio X; de uma distribuição de fre- 
quência. Demonstrar que, se todos os intervalos de classe têm a 


mesma, amplitude de c: (a) os desvios são todos múltiplos.de c, i. €., - 


dq = cu em que u= 0, = 1, +2, ...; (@j a média aritmética 
pode ser calculada por meio da fórmula X = A + (Z£ ) c. 


Solução: 


(a) O resultado está ilustrado ne tabela do Probl. 20, na qual se pode 
observar que os desvios da coluna 2 são todos múltiplos da amplitude do inter- 
valo de classe e = 8 em, 

Para verificar que o resultado é verdadeiro, de um modo geral, note-se que, 
se Xi Xa Xa... são pontos médios sucessivos, sua diferença comum é, nesse 
caso, igual a c, de modo que X: = X; +6, X = X, +2, e em geral, Xj = 
= X, + (j — Ie. Portanto, dois pontos médios quaisquer, Xp e Xa por 
exemplo, diferirão de 


Xp — Xa = UM + (P — Dei — [Xr+ ta Do = (p — ge 
que é múltiplo de c. 
(b) De acôrdo com (a), os desvios de todos os pontos médios, em relação 
a ùm outro dado, são múltiplos de c, i.e, dy = ct. Então, conforme o Probl. 
18b), tem-se: 


Fa È jid Zjeud 44, BBU, Z ju 
K= 4 + y A + N Ate A+ y fe 
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Note-se que êsse resultado é equivalente a X =A +eu que pode ser de- 
duzido de X = À + à, mediante a substituição de d por cu e a observação 
de que d = cÙ (veja o Probl. 18). 

22. Usar o resultado do Probl. 21 (b) para determinar a 
altura média. dos 100 estudantes do sexo masculino da Universidade 
XYZ (veja o Probl. 20). 

Solução: 

O cálculo pode ser disposto como na Tabela 3.3. O método é denominado 
processo abreviado (desvio em classes) e deve ser empregado sempre que fôr pos- 
sível. 


Xe4+ (2) e = 170,5 H5) 8 = 1717 em. 


N 
Tabela 3.3 

X u Í tu 

154,5 —2 5 ~ 10 

162,5 id 18 — 18 

A 170,5 0 42 0 

178,5 1 27 27 

186,5 2 8 16 

a j : 
N = 100 Eju=15 

j aaa 


23. Calcular o salário médio semanal de 65 operários da Compa- 
nhia P & R, por meio da distribuição de frequência da pág. 52, usando: 
(a) o método longo; (b) o método abreviado (desvios em valores): 


Solução: 
a . 
a Tabela 3.4 
-T ` 
X $ IX 
Cr$ 5 500 8 Cr$ 44 000 
6 500 10 85 000 
7 500 16 120 000 
8 500 14 119 000 
9 500 10º 95 000 
10 500 -5 52 500 
11 500 2 23 000 
N = 65 [ZIX = Cr$ 518 500 


= Cr$ 7 977. 


l 
' 
i 
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(db) Tabela 3.5 
x u F fu 

Cr$ 5 500 — 2 8 — 16 
6 500 —1 10 — 10 
A—> 7 500 of 16 0 
8 500 1 H 14 
9 500 2| 10 20 
10 500 3 5 15 
11 500 4 2 8 
N =65/Bju=31 

o E 


= z 
Ea (E) = 187500 - (a ces 3000 =797. 

Poder-se-ia supor que há introdução de êrro na tabela acima, visto que os 
pontos médios são, realmente, Cr$ 5 499 e Cr$ 6 499 etc., em vez de Cr$ 5 500 
e Cr$6 500 etc. Se, na Tabela, 3.4 fôssem usados os pontos médios verdadeiros, 
x tornar-se-ia Cr$ 7 976 em vez de Cr8 7 977, e a diferença é desprezível. 


24. Determinar os salários médios de 70 operários da, Com- 
panhia P & R, usando a Tabela (d) da pág. 60: 
ahon AA D eTa 


Neste caso, os intervalos de classe não têm a mesma amplitude e deve-se 
usar o método longo, como está indicado na Tabela 3.6. 


Tabela 3.6 
x ; 1 JX 
Crg 5 500 8 Cr$ 44 000 
8 500 10 65 000 
7 500 16 120 000 
8 500 15 127 500 
9 500 10 95 000 
11 000 8 88 000 
15 000 3 45 000 
N =70 BJX = 584 500 
= 
a ZIX  Cr8 584500 = CrS 8 350. 


N 


70 


car. 3 MÉDIA, MEDIANA, MODA E OUTRAS 89 


A mediana 
E 


25. Os graus de um estudante em seis exames foram: 84, 91, 
72, 68, 87 e 78. Determinar a mediana dos graus. 

Solução: 

Dispostos em rol, os graus são: 68, 72, 78, 84, 87, 91. Portanto, há número 
par de graus, com dois.valores centrais, 78 e 84, cuja média aritmética, (78 + 
+ 84) = 81, éa mediana pedida. Comparar com o Probl, 6, no qual à média 
aritmética é igual & 80. 

26. Os salários-hora de cinco empregados em um escritório 
são: Cr$ 126, Cr$ 198, Cr$ 164, Cr$ 460 e Cr$ 188. Determinar: 
(a) a mediana dos salários-hora e (b) a média dos salários-hora. 


Solução: 
(a) Ordenados eim rol, os salários são: Cr$ 126, Cr$ 164, Cr$ 188, Cr$ 198 
e Cr$ 460. Como há número impar de salários-hora, há apenas um valor 
central, Cr$ 188, que é a mediana pedida. . 
(b) A média aritmética, é: 
Cr$ 126 + Cr$ 164 + Cr$.188 + Cr$ 198 + Cr$460 | Cr$ 227 
a > ; 
Note-se que a mediana não é afetada pelo valor extremo, Cr$ 460, enquanto 


que.a média o. é... Neste. caso, a mediana. dá uma melhor, indicação do salário- 0, 
“* -hora médio dos empregados. . 


27. Se há: (a) 85 e (b) 150 números ordenados em rol, como se 
determinaria a mediana dêsses números ? 


. Solução: 


(a) Como há 85 itens, número fmpar, há sômente um valor central, com 42 
números abaixo e 42 acima dêle. Então, a mediana é o 43.º número do rol. 

(b) Como há 150 itens, número par, existem dois valores centrais, com 74 
números abaixo e 74 números acima dêle. Os dois valores centrais são o 75º e o 
76.º números do rol, e sua média aritmética será a mediana pedida, 

28. Determinar a mediana dos pesos dos 40 estudantes do sexo 
masculino da State University (veja o Probl. 8, pág. 55) usando: 
(a) a segunda distribuição de fregiiência do Probl. 8, aqui reprodu- 
zida e (b) os dados originais. 


Solução: 


(a) 1.º método, por meio de interpolação: 


-Admite-se que os pesos, na distribuição de frequência indicade à direita, se 
diatribuem continuamente. Nesse caso, a mediana é 0 pêso pars o qual a metade 
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Tabela 3.7 da frequência total (40/2 = 20) fica situada 
T Peso (Kg) abaixo e a outra acima dêle. 


Fregiiência 

Ora, a soma das três primeiras frequên- 
cias de classe é 3 +5 +9 = 17. Então, para 
obter o 20º pêso desejado, são necessários 
mais 3 dos 12 casos existentes nº. quarta 
classe. Como o quarto intervalo de classe, 
72,5 — 78,5 corresponde realmente 208 pesos 
de 72,25 a 76,75, a mediana situa-se a 3/12 
da distância entre 72,25 e 76,75, e é 


72,25 + -5 (76,75 — 72,25) = 72,25 + -2- (4,5) = 73,4 kg. 


2º método, com emprêgo da fórmula: 


Como a soma, das três e das quatro primeiras freqiências de classe são, res- 
pectivamente, 3 + 5 -+9 = 17e3 -+85 +9 -+12 = 29, é claro que a mediana 
situa-se na 4.º classe que é, portanto, a classe medians. Então: 


Li = limite inferior verdadeiro da classe mediana = 72.25 kg; 
N = número de itens dos .dados = 40; 
(Ef): = soma de tôdas as classes abaixo da classe mediana = 3 +5 +9 = 17; 
Ímedinns = frequência da classe mediana = 12; 
“e = amplitude do intervalo ds classe médiana = 4,5 e, dessa forma, 


frssaiana ar 


40 
` — (2) — — 17 ` : 
Mediana = Zn + (2 Zn) = 72,25 + 2 45 = 734 kg. 
12 


(b) Ordenados em rol, os pesos originais são: 
59,5, 62,5, 63, 04, 66, 67,5, 67,5, 67,5, 68, 69, 70, 70, 71, 71, 72, 72, 72,5, 72,5, 73, 
73, 73,5, 73,5, 74, 74,5, 75, 76, 76,5, 77, 78, 78,5, 79, 80,5, 81,5, 82, 82,5, 84, 
86,5, 88. 


A mediana éa média aritmética dos 20.º e 21° pesos dêsse rol e é igual a 73 kg. 


28. Mostrar como a mediana dos pesos do problema precedente 
pode ser deduzida de: (a) um histograma e (ò) uma ogiva percentual. 


Solução: 


(a) A Fig. 3-3(0) apresente o histograma correspondente aos pesos do, 


problema precedente. 4 mediana é a sbseissa correspondente à linha LM que di- . 


vide o histograma em duas áreas iguais. Como as áreas correspondem às fre- 
qiiências do histograms, LM é tal que ás áreas totais à sua direita e à sua esquerda 
são igueis à metade da freqüência total/ou 20. Ora, as áreas AMLD e MBEL 
correspondem às frequências 3 e 2. Então, AM = 3/12AB = 3/12 (4,5) = 1,125 
e » mediana tera o valor 72,25 + 1,125 = 73,375 ou 73,4 kg, com aproximação 
sté décimos de quilo. O valor pode, aproximadamente, ser lido tarabém dire- 
tamente no gráfico. 3 5 
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(b) A Fig. 3-3(b) represente o polígono de frequência relativo acumulada, 
ou ogiya percentual, correspondente aos pesos do problema precedente. A mediana 
é a abscissa do ponto P dessa ogiva, cuja ordenada é 50%. Pars calcular êste 
valor vê-se, nos triângulos. semelhantes POR e RST, que: 


pregtêncio Relativo Acuraviedo (am %) 


N 


20 
aain 
61 653 70 74,3 19 833 88 38,73 LS GTS Es Th Io aLa 0595 20 
Psa (quilos) £ Fko tolos) 
Fig. 3-5(0) Fig. 3-30) 


RQ n PO ou BO n 20% 425% n L, de modo que RQ = LÊ = 1,125. 
RS Sra T25% 425% 4 getan 


Então: 
Mediana, = 72,25 + RQ = 72,25 + 1,125 = 73,275 kg ou 73,4 kg, 
aproximados para décimos de quilo, Fase valor pode, aproximadamente, ser 
também lido diretamente no gráfico. 


30. Determinar a mediana dos salários de 65 operários da 
Companhia P & R (veja o Probl. 3,:da pág. 52, Capítulo 2). 
Solução: 


Neste caso, N = 65, N/2 = 32,5. Portanto, a soma das duas e das três 
primeiras fregúências de classe são, respectivamente, 8 + 10 = 18 e 8 +10 + 
+ 16 = 34; a classe mediana é a 3.º Usando a fórmula: 


z 225 -1 
Mediana = L, + (2-2) = Cg 6099 + 2 z) x 
Ímediana 16 


X Cr$ 1 000 = Cr$ 7 906. 
A moda 
31. Determinar a média, a mediana e'a moda do conjunto 
dos números: (a) 3, 5, 2, 6,-5, 9, 5, 2, 8, 6; (b) 51,6, 48,7, 50,3, 49,5 
e 43,9. 
Solução: 
(a) Ordenados em rol, os números são: 2, 2,3,5,5,5,86,6,8.9. 


Média =1/10 (2 +2 +3 +5+5+5+6+6+8+9)= 
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Mediana = média aritmética dos dois valores centrais = 1/2 (5 + 5) = 5. 
Moda = número que ocorre com maior fregência = 5. 
(b) Ordenados em rol, os números são; 48,7, 48,9, 49,5, 50,3 e 51,6. 
Média = 1/5 (48,7 + 48,9 + 49,5 + 50,3 + 51,6) = 49,8. 
Medians = número central = 49,5. 

foda = número que ocorre com mais fregiiência; não existe nesse caso, 

32. Instituir uma fórmula 

para determinar a moda dos da- 
dos apresentados em uma distri- 
buição de fregiiência. - 


Solução: 


Suponha-se que a Fig. 3-4 repre- 
senta três retângulos do histograma de 
uma distribuição de fregúência e” que o 
retângulo central corresponde à classe 
modal. Suponha-se, também, que os in- 
tervelos de classe têm a. mesma amplitude. 

A moda é definida como a abscissa 


n A ş 
Fig. 3-4 X do ponto de intercessão P das linhas 
tracejadas QS e RT. 

Sejam X = Ly e X = U; os limites verdadeiros, inferior e superior, da classe 
modal « Ay Az, respectivame nte, os excessos da frequência da classe modal sôbre 
as das classes à sur direita e à sus esquerda, 

EP PE ndE 


Nos triângulos semelhantes PQR e PST tem-se RG Si ou 


A 
ERES A 
ARE Então: 
A Gg en gs g A A 
A(X =~ La) = AU = X) O. AX — Aola = AD, — AX (A, + AX = 
= AUi + ola ` 


f E n AU + Bra 
ou = Ay + ds 
Como U; = Ly +6, em que e é a amplitude do intervalo de classe, aquela 


expressão torna-se: 
^ Aate tAk (Mt Any + Ap n+( A Je 


Edição Åi + do A+ do 

fisse resultado tem » seguinte interpretação interessante. Se" se constrói 
uma parábola que passa pelos três pontos médios dos topos dos retângulos da 
figura, sua abscissa máxima será a moda, como foi acima obtida, 

33. Determinar o salário modal dos 65 empregados da Com- 
panhia P & R (veja Probl. 23), usando a fórmula instituída no 


Probl. 32. 
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Solução: 
* Nesse caso, Ly = Cr$ 6999, À, = 16 — 10 = 6, A, = 16 — 14 = 2, c = 
= Cr$ 1 000. go É 
Então: 
6 


) em O18 6 oo + (+) Crê 1000 = 


Moda = L + ( 
= Cr$ 7750. 


Relação empírica entre a média, a mediana e a moda 


34. (a) Usar a fórmula empírica Média — Moda = 3 (Média — 
— Mediana) para determinar o salário modal dos 65 empregados da 
Companhia P & R. 

(b) Comparar o resultado com a média obtida no Probl. 33. 


Solução: 

(a) Nos Probis. 23 e 30 encontram-se: Média = Cr$ 7 977, Mediana =. 
= Cr$ 7 906. Então: 

Moda = Média ~ 3 (Média — Mediana) = Cr$7 977 — 3(0r8 7 977 ~ 
— Cr$ 7 906) = Cr$ 7 764. 

(b) No Probl. 33, o salário modal determinado foi Cr$ 7 750; portanto há, 
neste caso, boa concordância com o resultado empírico. 


A média geométrica 
35. Determinar: (a) a média geométrica; (b) a média aritmética" 
dos números 3, 5, 6, 6, 7, 10,12. : Admita-se que os números são exatos. 


Solução: ` 


(a) Média geométrica = G = Y3 X5 X6 X6 X7 X10 X12 = V453 600. 
Por meio de logaritmos decimais: 


log € = 5 log 453 600 -+ (5,6567) = 0,8081 e 


G = 6,43 (arredondado para centésimos) 
Outro método: 


log G = 5 (log 3 + log 5 -+ log 6 + log 6 + log 7 + log 10 + log 12) = 


= -> (0,4771 4 0,6990 + 0,7782 + 0,7782 + 0,8451 + 1,0000 + 
+ 1,0792) = 0,8081 .`. G = 6,43. 
(b) Média aritmética = X = + BG +5 +6+6 H74 IO 412) = 7 


Teso mostra que a média geométrica de um conjunto de números positivos, 
desiguais é menor do que a aritmética. 


94 ESTATÍSTICA 


36. Os números Xı, Xo, --., Xg ocorrem com as fregiiências 
fo fo o fa sendo fi + ht diz = N a fregiência total. 


(a) Determinar a média geométrica G dos números. (b) Deduzir 
uma expressão para log G. (c) Como poderia ser utilizado o resul- 
tado para determinar a média, geométrica dos dados agrupados de 
uma distribuição de frequência ? ; 


Solução: 
No XL ANa ep oe ARAK e. XE 
(a) G = g Nm aa a e Nm img O E 
fi vêzes, bo vêzes ix vêzes 


yo 
J, Xi. JK 
= VZG Xh Mg, 
` em que N = Ẹj. Essa expressão é, às vêzes, denominada média geométrica pon- 
derada. 


O) bog G = E ogh o X É 37 dilok Ni dra log Xet 


K y é 
 SylgX 
DE bi log Xy = SEA, 


ct fK log ÑK) = y 
ai Ê 


em que se admite que todos os números são positivos pois, de outro modo, os 
logaritmos não seriam definidos. 


Note-se que o logaritmo da média geométrica de um conjunto de números 
. positivos é a média aritmética dos logaritmos dos números. E 


(c) O resultado pode ser empregado para determinar a média geométrica de 
dados agrupados, considerados Xu Xa o XK como os pontos médios e 
Ju fa -.., JK como as frequências de classe correspondentes. 

37. Durante um ano, a relação do preço do litro de leite para 
o de um pão foi 2,50, ao passo que, durante o ano seguinte, foi 2,00. 
(a) Determinar a média aritmética dessas duas relações para O 
período de dois anos. (b) Determinar a média aritmética das rela- 
ções do preço do pão para o do leite, para o período de dois anos. 
(© Discutir a conveniência do emprêgo da média aritmética para 
calcular as relações médias. (d) Discutir a conveniência da média 
geométrica para o cálculo das relações médias. i 


Solução: 


(a) Relação média do preço do leite para o do pão = $ (2,50 + 2,00) = 2,25. 


(b) Como essa relação é de 2,50 no primeiro ano, a do preço do pão para o - 


do leite é 1/2,50 = 0,40. Semelhantemente, a do preço do pão para o do leite, 
no segundo ano, é 1/2,00 = 0,50. Então: 


Relação média do preço do pão para o do leite = $ (0,40 + 0,50) = 0,45. 
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(e) Poder-se-ia esperar que & relação média do preço do leite para. o do pão 
fôsse à recíproca da do pão pars o do leite, se a média fôsse apropriada. Entretanto, 
{J045 = 211 = 2,25. 


Tsso mostra que a média aritmética é de pouco valor para ser utilizada em 
relações. 


(d) A média geométrica das relações entre o ‘preço do leite e o do pão = 
= V 2502,00) = 45,00. 
A média geométrica das relações entre o preço do pão e ò do leite = 


= (0,10) (0,50) = (0,20) = q 


1 Paren 
ws 1/500. 


5, 


Como essas médias são recíprocas, conclui-se que a média geométrica é mais 
conveniente do que a aritmética para determinar as relações médias dêsse tipo de 
problema. 


38. A contagem de bactérias, em uma certa cultura, aumentou 
de 1 009" para 4 000 em três dias. Qual foi a percentagem média 
de acréscimo por dia ? 


Solução: 


Com o acréscimo de 1 000 para 4 000 é de 300%, poder-se-ia ser levado a 
concluir que a percentagem média. de acréscimo por dia é de 300%/3 = 100%. 


` Isso, contudo, importaria em ter aumentado a contagem, durante o primeiro 


dia, de 1 000 para 2 000; durante o segundo de 2 000 para 4 000; e, durante o ter- 
ceiro, de 4 000 para 8 000, o que é contrário aos fatos. 


Para determinar essa percentagem média de acréscimo, representa-te o acrés- 
cimo por 7. Então: 
Contagem total de bactérias depois do 1.º dia = 1 000 + 1 0007 = 1 000 (1+7) 


Contagem total de bactérias depois do 2.º dia = 1 000 (1 + r) + 1 000 (1 + 
+ 1) =1000(1 +71) 


Contagem total de bactérias depois do 3.º dia = 1 000 (1 + rê + 1000 (1 + 
+= 1000 (1 +). 


Esta última expressão deve ser igual a 4 000, de modo que 1 000 (1 + r = 
=4 00. (0 +Y S4 pre VA re VAL 


Mediante o emprêgo de logaritmos, determina-se y4 = 1,587, donde 
r = 0,587 = 58,7%. 


De maneira geral, se se parte de uma quantidade P, que cresce a uma taxa 
constante r por unidade de tempo, tem-se, após n unidades de tempo, um total: 


AS PLA 


Essa é a denominada fórmula de juros compostos (veja-os Probis. 94 e 95). 
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A média harmônica 


39. Determinar a média harmônica H dos números 3,5,6,5, 7, 
10 e 12. 


Solução: 
do E E. EO RD MONARCA NR 
HONZEST SHTtS te tT toti)" 
aa 140 +88 +70 +70 +00 + 42 +36) = SOL my 2940 
7 420 = zog = = 587 


Muitas vêzes é conveniente exprimir, primeiramente, as frações sob a forma 
decimal, Assim: 


1 1 : 5 ; 
-y = 7 (03338, + 0,2000 + 0,1667 + 0,1667 + 0,1429 + 0,1000 + 0,833) = 


4 l 7 
7 (11929) e H Iso 5,87. 


A comparação com o Probl. 35, exemplifica o fato da média harmônica de 
vários números positivos, que não são todos iguais, ser menor do que a média 
geométrica que, por sua vez, é menor do que a aritmética, ~ 

40. Durante quatro anos sucessivos, o proprietário de uma casa 
comprou óleo para sua caldeira aos preços, respectivamente, de 16, 
18, 21 e 25 cents por galão. à 


Qual foi o custo médio do óleo para todo o período de 4 anos? 


Solução: 
. Le Caso: 
Suponha-se que o proprietário comprou a mesma quantidade de óleo cada 
ano, ou seja, 1 000 galões. 
Então: 


Custo médio = - custo total sa 
se o quantidade total comprada 


 $160 +3180 + 8210 + $ 250 
4000 galões = 20 gigal. 


Essa é a média aritmética dos custos por galão, ie., 
1 
F (16 + 18 + 21 + 25) = 20 gigal. 


Ésse resultado seria o mesmo, sempre que fósse usado igual número x-de galões 
em cada ano. 
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2.º Caso: 
* Suponha-se que o proprietário despenda a mesma quantia anualmente, ou 
seja, $ 200. Então: 
custo total 


x dora a CUSTO E, i 
Custo: médio quantidade total comprada 


= $ 800 
(1250 + 1 111 + 952 + 800) gal. 


= 19,5 gigal. 


Isso é o mesmo que a média harmônica dos custos por galão, i e., 


4 
mm E = 19,5 4 
I pa RE Es = 19,5 flgal 
16 “as "21 "2% 
« 
Ésse resultado seria. o mesmo, sempre que fôsse despendido o mesmo número 
de dólares cada ano. 
Ambos os processos para avaliar as médias são corretos, cada uma tendo ' 
sido calculada para as diferentes condições predominantes, 
Note-se que, no caso do número de galões usados variar de ano para, ano, em 
vez de permanecer constante, a média aritmética ordinária do 1.º caso será subs- 


tituída pela ponderada, Semelhantemente, se a quantia total despendida variar 
de ano para ano, a média harmônica ordinária do 2.º caso será substituída pela 


ponderada. 

“41. Um homem viaja de 4 para B à velocidade média de 30 
km/h e volta de B para À, pelo mesmo caminho, à velocidade média. 
de 60 km/h. Determinar a velocidade média para a viagem completa. 


Solução: R 
Suponha-se que a distância de 4 a B é de 60 km (embora possa ser conside- 
rada qualquer distância). Então: 


- ; E EEE REE, 
Tempo para deslocar-se de 4 para B = 30 km/h 2 horas, 


60 km 
Tempo de B para A = dO kmh 1 hora 


e Velocidade média para a viagem completa = 


distância total 120 km 
= LSO O a MEE os 40 km/h. 
tempo total 3h O dem 
A média acima é a harmônica entre 30 e 60, i. è, q = 40 kmh, 
3 + 
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Se as distâncias percorridas não forem iguais, deverá ser adotada a média har- 
mônica ponderada das velocidades e os pesos serão as respectivas distâncias (veja. 
o Probi. 102). 

Note-se que poder-se-ia bem ser tentado a tomar a média aritmética de 30 © 
60 km/h, para obter 45 km/h, o que seria errado. 


A média quadrática, ou raiz da média quadrática 


42. Determinar a média quadrática dos números 3, 5, 8, 6, 
7, 10 e 12. 


Solução: 


Ra L e? a g2 aL Gè a na d O ` 
Rag =g? EE EO HO ETICI? 


Média quadrática 7 


= v57 = 7,55. 


43. Provar que a média quadrática de dois números positivos 
desiguais, « e b, é maior do que sua média geométrica. 


Solução: 


Deseja-se demonstrar que VHa? F} >. vab. Se isso é verdadeiro, 

elevar 2o-se, então, ambos os membros ao quadrado, d(a? + b?) > ab, de modo 

. que a +b? > 2ab. cat 2ab +b? > O,ou(a — b}? > 0. Mas, essa última de- 
sigualdade é verdadeira, porque o quadrado de qualquer número real diferente 
de zero deve ser positivo. 

A demonstração consiste em estabelecer o inverso da proposição acima. Para 
isso, partindo de (a — b} > 0, que se sabe que é verdadeiro, pode-sê provar que 
a +b? > 2ab, Hr) > abe, finalmente, VI E) > Vab, como era 
desejado. Observe-se que V 3(a? Fo 5 = Vab sòmente quando a = b. 


Quartis, decis e percentis 


44, Determinar: (a) os quartis OQ, Qa Q: (b) os decis 
Di, De, ..., Do, para os salários dos 65 empregados da Companhia 
P & R (ver o Probl. 3, Capítulo 2). 


Solução: 


(a) O primeiro quartil Q, é o salário obtido mediante a contagem de N/&= 
= 65/4 = 16,25 casos, a partir ds primeira classe (mais baixa). Como a primeira 
classe contém 8 casos, devem-se tomar 8,25 (16,25 — 8) dos 10 casos da segunda 
classe. Mediante o método de interpolação linear tem-se: 


= Cr$ 6 825. 


Qı = Cr$5 999 + 
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O segundo quartil Q» é obtido mediante a contagem dos primeiros 2N/4 = 
= N/2 = 65/2= 32,5 casos. Como as duas primeiras classes compreendem 18 
casos, deve-se tomar 32,5 — 18 = 14,5 dos 16 casos da terceira classe; então 


Q = Cr$6 995+ Ha (Cr$ 1 000) = Cr$ 7 906. 


Note-se que Q: é, realmente, a mediana. 


O terceiro quartil, Qa, é obtido mediante a contagem dos primeiros 3N/4 = 
= 9/4(65) = 48,75 casos. Como as quatro primeiras classes compreendem 48 ca- 
sos, deve-se tomar 48,75 — 48 = 0,75 dos 10 casos da quinta classe. intão: 


Qa = Cr88 999 + as (Cr$ 1 000) = Cr3 9 075. 


Por isso, 25% dos empregados recebem Cr$ 6 825 ou menos, 50% recebera 
Cr$ 7 906 ou menos, 75% recebem Cr$ 9 075 ou menos. i 


(b) O primeiro, o segundo, ..., e o nono decis são obtidos mediante a conta- 
gem dos N/10, 2N/10,..., e 9N/10 casos, a partie da primeira classe (ou da 
mais baixa). Assim: A 

= Cr$4 999 + ga: (Cr$ 1 000) = Cr$ 5 812 ` 
D: = Cr$ 5 999 +Š a q (C$ 1 000) = Cr$6 500 
q 15 
Ds = Cr$ 6 999 + ETA (Cr$ 1 000) = Cr$ 7 094 


Di = Cr$ 6 999 + 7 (Cr$ 1 000) = Cr$ 7 500 


= Cr$ 6 999 qd Ca 8 (cr r$ 1 000) = C87 906 


De = Cr$7 999 + R (Cr$ 1 000) = (488 357 
Di = Cr 7 999 + TEË (Ci 1 000) = Cre 8 821 


Ds = Cr3 8 999 + E (Cr8 1 000) = Cr$9 400 


Ds = Cr$9 999 + 88 5 (cr81 000) = Cr$ 10 100. 
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Então, 10% dos empregados recebem Cr$ 5 812 ou menos, 20% recebem 


Problemas Suplementares 
Cr$ 6 500 ou meno: . 90% recebem Cr$ 10 100 ou menos. 


a 


Note-sé que o quinto decil 6 a mediana. O segundo, quarto, sexto e oitavo 
decis, que dividem a distribuição em cinco partes iguais, são denominadas quintis, . 
e são assim designados algumas vêzes na prática. 


Notação de somatório 
47. Escrever os têrmos de cada uma das seguintes somas indicadas: 


45. Determinar: (a) o trigésimo-quinto percentil; (b) o sexagé- 


4 5 3 N 
; . a S DM +2 O XP; (e) HU; + 6) (at) É 4 
simo percentil, para a distribuição do problema precedente. OL tY 6) DI 60) É GHO A 2 =e 


j»li j=l j=l 


4 
te) Z 4X; Yj 


j=l 


Solução: 


(a) O 35.° percentil, representado por Pas, é obtido mediante a contagem 
dos primeiros 35N/100 = 35(65)/100 = 22,75 casos, a partir da primeira classe 
(ou da mais baixa). Então, "como no Probl. 44, Pa = Cr$ 6 995 + 4,75/16 
(Cr$ 1 000) =.Cr8 7 297. Isso significa que 35% dos empregados recebem 
Cr$ 7 297 ou menos. 


Resp.: (a) X + Xo +X +X +8 
O) AXP HARP + XX + XE 
(c) Ui (U1 +6) + Us (U2 + 6) + Us (Us + 6) 
(@) YP HYPE... Yy AN 
(e) 4X1Y; + 4XoYo + 4XgYa + 4X4 Pa 


(b) O 60.º percentil é Peo = Cr$ 7 909 + 5/14(Cr$ 1 000) =Cr$ 8 357. 


Note-se que é igual ao 6.º decil ou ao 3.º quintil. 


46. Mostrar como os resultados dos Probls. 44 e 45 podem 
ser deduzidos de uma ogiva percentual. 


48. Exprimir cada uma das seguintes somas, mediante o emprêgo da no- ` 
tação de somatório. E ` 

(e) (Xi +3 + (Xa +3 + (Xo +3% 

6) ji (Yr — a) + fa (Ya — a} ++ his (Yis = af 

© @X1 — 3YD + (2X, — 3Y) +... + (2XN — 3Fy) 

(DM — IPA (XAY — 1} +... + (Xs/Ys — IP 


Solução: 


A ogiva percentual, correspondente aos dados dos Probls..44 e 45, é a abaixo 
representada. 


h+p+-. Fha ` 


3 15 N 
Rep: DMA O DH- () DD e- 3r) 
j=l 


j=1 ja 


Froqbêneio Acumulada Solstivo (em %7} 


32 
(a) > (ž y 5 A i 
du Ny; E ;: 0 =z 
j=l 
fi 
fai 
Sulórios Ceruzolros? N -N N 
Fig. 3-5 49. Provar que 2o (Xj -1P = D xei x AN. 
j=1 isl FR UU 


O primeiro quartil é a abscissa do ponto da ogiva, cuja ordenada é 25%. Se- 
melhantemente, o 2º e o 3.º quartis são as abscissas dos pontos da ogiva, cujas 
ordenadas são, respectivamente, 50 e 75%. Os decis e os percentis podem ser 
obtidos de modo-semelhante. Por exemplo, o 7.º decil e o 35.º percentil são as 
“abscissas dos pontos da ogiva, correspondentes às ordenadas de 70 e 35%, res- 
pectivamente. 


50. Provar que S (X +a)(Y +0) = ZXY +aEY +bEX + Nob, em que 
ae b são constantes. Que notação por índice está implícita ? 


51. Duas variáveis, Ọ e V, assumem os valores U, = 3, Ua = — 2, U; = 5 
e Y=—4 V= — i, V3 =6, respectivamente. Calcular: (a) È UV; 
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e) HU +D — 4% (9) Ev; (0) ED EE o) ZUY; () ZU? — 27º +2); 
(9) ZUY) 


Resp: (0) 20; (b)—37; (0)53; (0)8; (0)226; U) — 62; (9) 25/12. 


4 
Dyw=-3 e 
j=l 


4 
A X;Y =5, determinar: 
j=l” É 


4 
52. Dados 2, Xj =7, 


jmi 


4 4” 
a Leo tS O E G-NCH+D. 


je) j=l 


Resp: (0) — 1; (b) 28. 


A média aritmética 


53. Um estudante recebeu os graus 85, 76, 93, 82 e 98 em cinco matérias. 
Determinar a médis aritmética dos graus. ` 
Resp.: 86. 


54. Os tempos de reação de um indivíduo s determinados estímulos foram 
medidos por um psicologista, como sendo 0,53; 0,46; 0,50; 0,49; 0,52; 0,53; 0,44 e 
e 0,55 segundos, respectivamente. - Determinar o tempo médio de reação do in- 
divíduo » êsses estímulos. 


Resp.: 0,50 segundo. 


l 55, Um conjunto de números é composto de seis 6, sete 7, oito 8, nove.9 e 
dez 10. Qual é a média aritmética dos números? 


Resp.: 8,25. 


56. Os graus de um estudante nas disciplinas de laboratório, leitura e decias- 
mação de um curso de ciências foram 71, 78 e 89, respectivamente. (a) Se os 
pesos atribuídos a êsses graus são 2, 4 e 5, respectivamente, qual é o greu médio 
apropriado? (b) Qual serie o grau médio se fôssem adotados pesos iguais? 


Resp.: (a) 82; (b) 79. 


57. Três professôres de Economia atribuíram os graus médios de exame de 
75, 82 e Bi a suas respectivas classes, que se compunham de 32, 25 e 17 estudantes, 
respectivamente. Determinar o grau médio para iôdas as classes. 


Resp.: 78. 


58. O salário médio anuel pago a todos os “empregados de uma companhias 
foi Cr$ 500 000. Os salários médios anuais pagos 809 empregados dos sexos 
masculino e feminino da companhia foram Crê 520 000 e Crê 420 000, 
respectivamente. Determinar as percentagens dos empregados de cada sexo, de 
companhia. É 


Resp: 80 e 20%. 
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59, A Tabela 3.8 mostra a distribuição, em Tabela 3,8 
toneladas, das cargas máximas suportadas por paia 
certos cabos fabricados por uma compenhia. De~ Carga Máxima! Número de 
terminar a média das cargas máximas, usando: (toneladas) cabos 
(a) o “método longo”; (b) o método abreviado. 


Resp.: 11,09 t. HH = 
60. Determinar X pars os dados da Tabe- los pe 
la 3.9, usando: (a) o “método longo"; (b) o méto- W3 — 
-do abreviado. 11,8 -— 
Resp.: 501,0 12,8 — 
À 12,8 — 
Total 60 
Tabela 3.9 
x 462 480 408 516 534 552 570 588 606 64 


1 j 987% 56 42 30 2 3 CH 8 2 


rm 


a A Tabela 3.10, abaixo, mostra a distribuição dos diâmetros das cabeças 
dos rebites fabricados por uma companhia. Calcular o diâmetro médio. 
Resp.: 0,72642 polegada. 


Tabela 3.10 Tabela 3,11 
Diâmetro (polegadas)| Fregiiência Classe Frequência 
E 5 ; + 
0,7247 — 0,7249 2 10 até 15 exclusi j 
0,7250 — 0,7252 6 15 até 20 poao H 
0,7253 — 0,7255 8 20, até 25 ” 16 
0,7256 — .0,7258 15 25 até 30 ” 12 
0,7259 — 0,7261 42 30 até 35 ” 9 
0,7262 — 0,7284 68 35 até 40 ” 5 
0,7265 — 0,7267 49 40 até 45 ” 2 
0,7268 — 0,7270 25 
ozn — 0,7273 18 i 
T214 — 0,7276 12 T 
0,7277 — 0,7279 4 N 
0,7280 — 0,7282 1 mm 
| Total 250 


62. Calcular a média dos dados da Tabela 3.11, acima. 
Resp: 26,2. 
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63. Calcular a duração média das válvulas fabricadas pela” Companhia 
L & M de válvulas, constantes do Probl. 20, Capítulo 2. 
Resp.: 715 horas. 


64. (a) Usar a distribuição de frequências obtida no Probl. 27, Capítulo 2, 
para calcular o diâmetro médio dos rolamentos de esferas. (è) Calcular a 
média. diretamente dos dados brutos-e comparar com (a), explicando qualquer 
discrepância que possa ocorrer. 

Resp.: (b) 7 349 polegadas. 


A mediana 


65. Determinar a média e a mediana dos conjuntos de números: 

(a) 5, 4, 8, 3, 7, 2, 9; (b) 183, 20,6, 19,3, 22,4, 20,2, 18,8, 19,7, 20,0. 

Resp.: (a) Média = 5,4, mediana =5; (b) Média = 19,91, mediana = 
= 19,85. 


66, Determinar o grau mediano Es Probl, 53. 


Resp.: 85. 


67. Determinar o tempo de reação mediano do Probl. 54. 
Resp.: 51 segundos. 


68. Determinar a mediana do conjunto de números do Probl. 55. 
Resp.: 8. 


69, Determinar a mediana das cargas má- 
ximas dos cabos do Probl. 59. Tabela 3.12 
Resp: 11,07.t. 


70. Determinar a mediana X da distribui- Idade do Chefe| Número 
ção do Probl. 80. da Família (anos)(em milhões) 


Resp.: 490,6. 


71. Determiner o diâmetro mediano das Menon doa 


25 — 29 4,05 
cabeças de rebites do Probl. 61. 30 — 34 5,08 
Resp.: 0,72638 polegada. 35 — 44 10,45 
45 — 54 9,47 
72. Determinar a mediana -da distribuição 55 — 64 6,63 
do Probl. 62. So da me 
Resp. 25,4. 75 ou mais 1,66 
73. A Tabela 3.12 apresenta a distribuição, | Total 43,72 
por idade, de chefes de família, durante o ano de i 


1957. (a) Determinar a idade mediana. (b) Por 
que, neste caso, a mediana é mais conveniente Fonte: Bureau of the Census. 
do que a média. para medir a tendência central ? 

Resp: 45,1. 


74, Determinar o rendimento mediano, referente aos dados do Probl. 31, 
Capítulo 2. 


Resp.: Cr8 3 608. 
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75. Determinar a duração mediana das válvulas do Probl. 20, Capítulo 2. 
Resp.: 708,3 horas. 


A moda 


76. Determinar a média, a mediana e a moda dos conjuntos de números: 

(a) 7, 4, 10,9, 15, 12, 7, 9, 7; (6) 8, 11, 4, 3, 2, 5, 10, 6, 4, 3, 10, 8, 12, 6, 5, 7. 

Resp.: (a) Média = 8,9, mediana = 9, moda =7, (b) Média = 6,4, me- 
diana = 6. Como cada um dos números 4, 5,6, $ e 10 aparece duas vêzes, po- 
de-se considerar que êles são as cinco modas. Entretanto, é mais racional con- 
cluir que, neste caso, a moda não existe. 


77. Determinar o grau modal do Probl, 53. 
Resp.: Não existe. 
78. Determinar o tempo de reação modal do Probl, 54. 
Resp.: 0,53 segundos. e 
79. Determinar a moda do conjunto de números do Probl, 55. 
Resp.: 10. 
80. Determinar a moda das cargas máximas dos cabos do Probi. 59. 
Resp.: 11,06 t. t 
A 
81. Determinar a moda X da distribuição do Probl. 60. 
Resp.: 462. 


82. Determinar o diâmetro modal das cabeças de rebites do Probl, 61. 
Resp.: 0,72632 polegada 


83. Determinar a “moda da distri uição do Pro L 62. T- 


Resp.: 23,5. 


84. Dëterminar a duração modal das válvulas do' Probl. 20, Capítulo 2. 
Resp.: 668,7 horas. 


85. Dizer se é possível determinar as modas das distribuições do: (a) Probl. 73 
dêste capítulo; (b) Probl. 31, Capítulo 2. ‘Justificar as respostas, 


86. Usar a fórmula empírica Média — Moda = 3 (Média — Mediana), 
para calcular as modas das distribuições do: (a) Probl. 59; (è) Probl. 60; (c) 
Probl. 61; (d) Probl. 62; (e) Probl. 20, Capítulo 2. Comparar os resultados 
com os calculados por meio da Fórmula (9), pág. 75, explicando qualquer con- 
cordância ou discrepância. 


87. Provar a proposição estabelecida no final do Probl, 32. 
À média geométrica 


88. Determinar a média geométrica dos números: (a) 4,2 e 16,8; (b).3,00 e 
6,00. 
Resp.: (à) 8,4; (b) 4,23. 
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89. Determinar: (a) a média geométrica G; (b) a média aritmética X dos 
números 2, 4, 8, 
Resp: (4) G = 


; 0) E = 124. 


80. Determinar a médis geométrica dos números: (a) 3, 5, 8, 3, 7, 2; (b) 
28,5, 73,0, 47,2, 31,5, 84,8. 
Resp: (a) 4,14; (b) 45,8. 


Si. Determinar a média geométrica das distribuições de: (a) Probl. 59; (6) 
Probl. 60. Verificar se, nesses casos, a média geométrica, é menor ou igual à média. 
Resp.: ta) 11,07 t; (b) 499,5. 


82. Se o preço de uma mercadoria dobra em um período de 4 anos, qual 
é o acréscimo médio percentual por ano? 
Resp.: 18,9%. 


93. Em 1950 e 1980, a população dos Estados Unidos (incluídos Alasca e 
Havaí) era de 151,3 e 179,3 milhões, respectivamente. - (a) Qual foi o acréscimo 
médio percentual por ano? (b) Avaliar a população em 1954. (c) Se o acrésci- 
mo médio percentual da população, gor ano, de 1960 a 1970 fôsse igual ao de (ad, 
qual seria a população em 1970? 

Resp: (0) 1,71%; (b) 161,9 milhões; (c) 212,5 milhões. 


98, Um capital de Cr$ 1 000, é investido à taxa anual de juros de 4%. 
Qual será o montante total depois de 6 anos, se não fôr retirado o capital inicial? 
Resp.: Cr$ 1 265. 


95, Se, no problema anterior, os juros forem acumulados trimestralmente 
(i. e, se há um dumento de 1% do capital cada três meses), qual será o montan- 
te total depois de 6 anos? 

Resp.: Cr8 1 269. 


96. Encontrar dois números, cuja média aritmética é 9,0 e geométrica é 7,2. 
Resp.: 3,6 e 14,4. 


A média harmônica 

97. “Determinar a média harmônica dos números: (a) 2, 3 e 6; (b) 3,2, 5,2, 
48, 61 e 4,2. 

Resp.: (a) 3,0; (b) 4,48. 

98. Determinar: (a) a média aritmética; (b) a média geométrica; (c) & 


média harmônica dos números 0, 2, 4, 6. 
Resp: (e) 3; W) 0. (0) 0. 


799. Se Xi, Xi. Xa, ... representam os pontos médios de ums distribuição 
de frequência, com as correspondentes frequências de elssse fi, fa fs -.., Ye3- 
pectivamente, demonstrar que a média harmônica H ds distribuição é dada por: 


em que N ef pf pa = Ef 
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100. Utilizar o probleina anterior para determinar a média harmônica das 
distribuições de: (a) Probl. 59; (b) Probl. 60. Comparar cora o Probl. 01. 

Resp.: (4) 11,04; (b) 498,2. 

101. As cidades A, Be C são equidistantes uma das outras. Um moto- 
rista viaja de 4 para B a 30 km/h, de B para'C a 40 km/h e de Ç para 4 a 50 
km/h. Determinar sua, velocidade média para à viagem tôda. 

Resp.: 38,3 km/h. 

102. (a) Um aeroplano percorre as distâncias dy do, da (em quilómetros), 
às velocidades vy va va km/h, respectivamente. Demonstrar que & velocida- 

dtdo td d Mi, 


de média é dada por Y, da expressão y E aa - É uma 


média harmônica ponderada. 

(b) Determinar V para dı = 2 500/dy = 1 200, da = 500, w = 500, vz = 400 
e va = 250. 

Resp.: (b) 420 km/h. 

103. Provar que a média geométrica. de dois números positivos 4, é b, é: (a), 
menor do que ou igual à média aritmética; (b) maior do que ou igual à média 
harmônica dos números. Poder-se-á estender esse demonstração para mais de 
dois números? 

Raiz da média quadrática ou média quadrática 


104. Determinar a raiz da média quadrática ou média quadrática dos nú- 
meros: (a) 11, 23, 35; (b) 27, 3,8, 3,2 e 4,3. : 
Resp.: (a) 25; (b) 3,55. 


165. Demonstrar que a raiz da média quadrática de dois números positivos, 
ae b, é: (a) maior do que ou igual à média aritmética; (b) maior do que ou igual à 
média harmônica. Poder-se-á estender essa demonstração para mais de dois 
números? 

106. Deduzir a fórmula que pode ser usada para determinar a rais média 
quadrática de dados agrupados e. aplicá-la em uma das distribuições de freqüên- 
cias anteriormente consideradas. é 


Quartis, decis e percentis Tabela 3.18 
107. A Tabela 3.13. apresenta uma distri- di ; i 
buição de frequência dos graus de um exame final Grau Aamen X e 
de álgebra. (a) Determinar os quartis da distri- etuganTes 
- buição. (b) Interpretar claramente o significado 
de cada um: 90 — 100 9 
$ imei aa E 80 — 89 32 
Resp.: (a) Primeiro quartil = Q, = 67, se~ 7 — 79 48 
gundo quartil = Qy = 75, terceiro quartil = 60 — 69 21 
= Q = 83. 50 — 59 11 
40 — 49 3 
(b) 25% obtêm grau 67 ou menór (ou 75% 30 — 39 a 
obtêm 67 ou maior), 50% obtêm 75 ou menor 
` {ou 50% obtêm 75 ou maior), 75% obtêm 83 Total 120 


ou menor (ou 25% obtêm 83 ou maior). L 
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108. Determinar os quartis Qi, Qz Qs das distribuições de: (a) Probl. 59; 
(b) Probl. 60; (c) Probl. 31, Capítulo 2. Interpretar claramente o significado 
de c 


Res, (a) Qi = 10,55, 
Qe = 490,6, Qs = 523,3; (©) Qu 


109. Determinar: (eyo 2.º decil; (b) o 4.º decil; (e) o 90º percentil; (d) o 68º 
percentil, referentes aos dados do Probl 73, interpretando claramente o signi- 
ficado, de cada. ` 

Resp: (a) 324; 


Q: 


= 11,57t; (b) Qi = 4693, 
133 608, Qs = 


(b) 40,0; (e) 68,5; (d) 53,4. 


no. Determinar: (a) Pio; (b) Poo; (c) Pos; (d) Prs, referentes aos dados 
do Probl, 59, interpretândo claramente o significado de cada. 
Resp: (a) 10,15; (b) 11,78; (e) 10,55; (d) 11,57 t. 


111. Todos os quartis e decis podem ser expressos como percentis? (b) 
Todos os quartis podem ser expressos como percentis? Interpretar. 


112, Com referência aos dados do Probl. 107, determinar: (a) o grau mais 
baixo obtido pelos 25% melhores alunos da turma; (b) o grau iais alto obtido pelos 
20% piores alunos da turma. Interpretar as respostas em têrmos de porcentis, 

Resp.: (a) 83; (b) 64. 


1137 Interpretar os resultados do Probl. 107, gràficamente, mediante o em- 
prêgo de: (a) um histograma percentual; (b) um polígono de freqüência percentual; 
(c) uma ogiva percentual. 


oI. Responder 40 -Probl. 113, mediante o emprêgo dos resultados do 


Probl, 108. 


115. (a) Instituir uma fórmula semelhante à Equação (8), pág. 74, para 
calcular qualquer percentil de uma distribuição de frequência. (W) Exemplificar 
o emprégo dessa fórmula, aplicando-a para obter os resultados do Probl. 110. 


CrS 5268. 


CaríruLo .4 


O DESVIO PADRÃO E 
GUTRAS MEDIDAS DE DISPERSÃO 


Dispersão ou variação 


O grau 20 qual os dados numéricos tendem a dispersar-se em tôrno 
de um valor médio chama-se variação ou dispersão dos dados. Dispõe-se 
de várias medidas de dispersão ou de variação, sendo as mais comuns 
a amplitude total, o desvio médio, a amplitude semi-interquartílica,, 
a amplitude entre os centis 10-90 e o desvio padrão, 


A amplitude total 
A amplitude total de um conjunto de números é a diferença entre 
o mais alto e o mais baixo do conjunto. É 


Exemplo: A amplitude total do conjunto 2, 3, 3, 5, 5, 5, 8 10, 12 6: 
12 — 2 =10. Algumas vêzes, & amplitude total é indicada, simplesmente, pela 
citação do menor e do maior número. No caso acima, por exemplo, à amplitu- 
de total poderia ser indicada como 2 a 12 ou 2—12. : 


O desvio médio de um conjunto de N números Xi, Xo.. XN 
é definido por: 


N 
XXX 
Desvio Médio = D.M. = = 


Zx- 


N W Ix- O) 


em que X éa média aritmética dos números elX; — X| é o valor abso- 
luto do desvio de X; em relação a X. (O valor absoluto de um número 
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é êle próprio, sem o sinal que lhe é associado, e é indicado pòr meio de 
duas linhas verticais que o enquadram. Assim,|-4|=4; |+8|= 
=3|6|=6;|-0,84| = 0,84) 

Exemplo: Determinar o desvio médio do conjunto de números 2, 3, 6,8, lt: 


2+3+6+8 +11 


Média Aritmética = ¥ = ZES EEESEIL a, 
Desvio Médio = D. M. = 2-6L+ l-el + ló-6) + |8-6l +li1-6l 


= d=4l+l=3l+lof+la 4 tol 


5 


4+3+0+2+5 3 
= aii ms 2,8, 
5 
Se Xi, Xo, ..., Xx ocorrerem com as frequências fá, Ja, -.., fro 


respectivamente, o desvio médio poderá ser indicado da seguinte 
forma: 


Pi Ep 1% - -3| 
Desvio Médio = D. M. = ZE! V E 
BIx-X eee 
-ZX -2i F, T 


ÉS 
em que N = dh = &j. Essa forma é vantajosa para os dados 


agrupados, quando os X, representam os pontos médios e os J; são 
as frequências de classe correspondentes. 


Ocasionalmente, o desvio médio é definido em térmos dos desvios 
absolutos, em relação à mediana ou à outra, média, em vez da aritmé- 


tica. Uma propriedade interessante da soma SE |X; — al é que ela 


é mínima quando a é a mediana, i. e., O desvio! médio em relação à 
mediana é um mínimo. 


Note-se que seria mais apropriado usar a terminologia desvio 
médio absoluto, em vez de desvio médio. 


A amplitude semi-interquartílica ou desvio quartílico de 
um conjunto de dados é definida por: 


Amplitude semi-interquartílica = Q = aa, (3) 
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em que Qie Q; são o primeiro e o terceiro quartis referentes aos dados 
(veja os Probls. 6 e 7). A amplitude interquartílica Q, — Qı é em- 
pregada algumas vêzes, masa amplitude semi-interquartílica é mais 
comum como medida de dispersão. 

A amplitude entre os percentis 10-90 de um conjunto de 
dados é definida por: 


Amplitude entre os percentis 10-90 = Po — Pros (4) 


-em que Poe Po são o 10º e o 90.º percentis referentes aos dados 


(veja o Probl. 8). A semiamplitude entre os percentis 10-90, 
$ (Poo — Pro), pode também ser emipregada mas não o é comumente. 


O desvio padrão de um conjunto de N números Xi, X», ..., 
Xy é representado por S e definido por: 


j=l 


EE N 


N = w: 
2G- E UE 
E GE a 


2 ii 

20 RÝ, © 

em que z representa o desvio de cada um dos números X; em relação 
à média x. 


Então, séa raiz média quadrática dos desvios, em relação à média 
ou, como é muitas vêzes denominada, O desvio da raiz média quadrática 
(veja a pág. 77). 

Se Xv Xa ..., Xx ocorrêrem com as frequências Jo do fx, 
respectivamente, o desvio padrão pode ser definido por: 


-r 
yÈ (X;— X? -4 2j (X — X} 
f N N Ze! 


2 ja? 
N 


=- 5}, (6) 


K y A 
em que N = Joj; = 2j. Esta fórmula é vantajosa para os dados agru- 
fa À 
pados. 
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Às vêzes, o desvio padrão correspondente aos dados de uma amos- 
tra é definido como (N — 1), em lugar de N nos denominadores das 
expressões (5) e (6), porque o valor que disso resulta representa uma 
estimativa melhor do desvio padrão da população da qual a amostra 
foi extraída. Para grandes valores de N (certamente N > 30) não há, 
praticamente, diferença entre as duas definições. Também, quando 
fôr necessária melhor estimativa, pode-se obtê-la sempre, multipli- 
cando-se o desvio padrão, calculado de acôrdo com a primeira defini- 
nição, por VN/N — 1). Por essa razão, podemos conservar a de- 
finição acima apresentada. 


A variância 


A variância de um conjunto de dados é definida como o quadrado 
do desvio padrão e é, então, representada por s?, símbolo definido nas 
Equações (5) e (6). 


Quando é necessário distinguir entre o desvio padrão de uma po- 


* pulação e o de uma amostra dela extraída, adota-se frequentemente 


o símbolo s para o último e o para o primeiro. Então, s? e g? repre- 
sentariam a variância da amostra e a da população, respectivamente. 


Métodos abreviados para o cálculo do desvio padrão 


As Equações (5) e (6) podem ser escritas, respectivamente, sob 
as formas equivalentes 


a) 


« 


8) 


em que X? indica a média dos quadrados dos diferentes valores de X, 
ao passo que XY? indica o quadrado da média dos diferentes valores 
de X (veja os Probis. 12 a 14). f 
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Sed=H- 4 é o desvio de cada valor de X; em relação a 
uña constante arbitrária 4, os resultados (7) e (8) tornam-se, res- 


` pectivamente, 


V eT, ; (9) 


e Ns aas 
px Jjd;? (& Jid; ) a q E jd ( Ejd y a 
i N NTN N 
=Vd — d , (10) 
Veja os Probls. 15 e 17. 


Quando os dados estão agrupados em uma distribuição de fre- 
qüência, cujos intervalos de classe têm a mesma amplitude e, tem-se: 


d; = cuj ou X; = A -+ou es expressão (10) torna-se: 


an 


Esta fórmula proporciona um método bastante abreviado para © 
cálculo do desvio padrão, que deveria ser empregado sempre para 
os dados agrupados, quando as amplitudes dos intervalos de classe 


“são iguais. É denominado método abreviado (desvio em classes) e 


é exatamente análogo ao utilizado para o cálculo da média aritmética 
dos dados agrupados, no Capítulo 3 (veja os Probls. 16 a 19). 


Propriedades do desvio padrão 


N. 
25G — a? 
Ea é jm], 
1. O desvio padrão pode ser definido por: s = ERR ARE R 
em que a é uma média próxima. da aritmética. De todos êsses desvios 


padrões, o mínimo é aquêle para o qual e = x, por causa da Proprie- 
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dade ®, Capitulo 3, pág. 72. Essa propriedade proporciona uma 
razão importante para que o desvio padtão seja definido sob a forma 
acima. Para a demonstração dessa propriedade, veja o Probi. 27. 


2. Para as distribuições normais (veja o Capítulo 7) isso signi- 
fica que: i 


(a) 68,27% dos casos estão incluídos entre X — s e X +s 
. (i. e. um desvio padrão de cada lado da média). 
(b) 95,45% dos casos estão incluídos entre X — 2s e F+9s 
(i. e. dois desvios padrões de cada lado da média). 
(e) 99,78% dos casos estão incluídos entre X—3se ¥ +3s 
G. e., três desvios padrões de cada lado da média). 


Isso está indicado na Fig. 4-1. 


y Para as distribuições moderadamente desviadas, as percentagens 
acima podem ser aproximadamente mantidas (veja o Probl. 24). 


Pig. 4-1 


3. Suponha-se que dois conjuntos constam de N; e N; números 
(ou duas distribuições com as fregiiências totais Ni e N. 2) tenham va- 


. riâncias represi 2 specti ia X 
riâncias representadas por s,º è 84º, respectivamente, e a mesma média X. 


Então, a variância conjunta ou combinada de ambos os conjuntos 
(ou ambas as distribuições de fregiiência) é dada por: 


Pee Nis? + Nas i ; 
Ni + No a2) 
Note-se que é a média aritmética ponderada das variâncias. Êsse 
resultado pode ser generalizado para 3 ou mais conjuntos. 
Contrôle de Charlier 
O contrôle de Charlier, para os cálculos da média e do desvio 


padrão pelo método abreviado (desvio em classes), utiliza-se das se- 
guintes identidades: 
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Eju t1) = Zju+ j= 2jutN, 

o Bju Hip = Ejeet 2u- 1) = Efu t2? jut Bj = 

Eju +2 fut N. 


j 


Veja o Probl. 20. 
Correção de Sheppard para a variância 


-O cálculo do desvio padrão conduz a um certo êrro, devido ao 
agrupamento dos dados em classes (êrro de agrupamento). Para cor- 
rigir o êrro de agrupamento, adota-se o seguinte resultado: 

Variância corrigida = variância dos dados agrupados ~- c?/12 (13) 
em que c é a amplitude do intervalo de classe. O têrmo corretivo, 
¢?|12, que é substrativo, é denominado correção de Sheppard. É usado 
para as distribuições de variáveis continuas, cujas “extremidades” 
tendem gradualmente para zero em ambas as direções. ` 

Os estatísticos divergem a respeito de quando e se às correções de 
Sheppard devem ser aplicadas. Certamente, elas não deveriam ser 
aplicadas sem um exame completo da situação. Isso não somente 
porque muitas vêzes elas tendem a supercorrigir, como também a 
substituir erros antigos por novos. Neste livro, a menos que haja 
indicação em contrário, não serão usadas essas correções. i 


Relações empíricas entre as medidas de dispersão 


Para as distribuições moderadamente desviadas há as fórmulas 

empíricas: 
Desvio Médio = 4/5 (desvio padrão), 
. Amplitude Semi-interquartílica = 2/3 (desvio padrão). 

Essas expressões resultam de ter sido determinado, para as dis- 
tribuições normais, que o desvio médio e a amplitude semi-interquar- 
tílica são iguais, respectivamente, a 0,7979 e 0,0745 vêzes o desvio 
padrão. 


Dispersão absoluta e relativa. Coeficiente de variação 


A variação ou dispersão real, determinada a partir do desvio 
padrão, ou qualquer outra medida de dispersão, é denominada dis- 
persão absoluta. Entretanto, uma variação ou dispersão de 10 em, 
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na medida de uma distância de 1.000 m, é inteiramente diferente, 
quanto ao efeito, da mesma variação de 10 em em uma distância 
de 20 m. A medida dêsse efeito é proporcionada pela dispersão re- 
lativa, definida por: 


Dispersão Absoluta . 


Dis ão Relativa = 
ispersão Relativa HA 


(14) 


Se a dispersão absoluta é o desvio padrão s e a média é a aritmé- 
tica X, a dispersão relativa é denominada coeficiente de variação ou 
de dispersão, dado por: 


Coeficiente de Variação = V = e (15) 
e geralmente expresso em percentagem. Outras possibilidades também 
ocorrem (veja o Probl. 30). 

Note-se que o coeficiente de variação é independente das unidades 
adotadas. Por esta razão, é vantajosa para a comparação de distri- 
buições cujas unidades podem ser diferentes. Uma desvantagem 
do coeficiente de variação é que êle deixa de ser útil quando F está 
próximo de zero. 


Variável reduzida, escores reduzidos 


A variável z= 


(16) 


que mede o desvio em relação à média, em unidades de desvio padrão, 
é denominada variável reduzida e é uma quantidade abstrata (i. e., 
„independe das unidades usadas). 

Se os desvios em relação à média forem dados em unidades de 
desvio padrão, diz-se que estão expressos em unidades reduzidas ou es- 
cores reduzidos. Essas grandezas são muito valiosas para a compara- 
ção das distribuições (veja o Probl. 31). 


Problemas Resolvidos 


À amplitude total 


1. Determinar a amplitude total de cada um dos conjuntos de 
números: (a) 12, 6, 7, 3, 15, 10, 18,5; (b) 9,3, 8,8,9, 8,9, 18. 
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Solução: 
= Em ambos os casos, amplitude total = número maior — número menor = 
= 18 — 3 = 15. Entretanto, como se vê nos róis de (a) e de (b), 
(a) 3,5, 6,7, 10, 12,15, 18; (b) 3, 8, 8, 8, 9, 9, 9, 18 


há variação ou dispersão muito maior em (a) do que em (b}. De fato, (b) consta, 
principalmente, de oitos e noves. 

Como a amplitude total não indica nenhuma diferença entre os conjuntos, 
não é ume boa medida de dispersão para êste caso, Em geral, quando houver 
valores extremos, 2 amplitude total é uma medida mediocre para a dispersão. 

Obtém-se um aperfeiçoamento, mediante a exclusão dos. casos extremos 3 o 18. 
Então, para (a), » amplitude total é (155) = 10, enquanto que para (ù) cla é 
{9 — 8) = 1, o que indica claramente o fato de (a) apresentar maior dispersão do 
que (b). Entretanto, não é dêsse modo que a amplitude total é definida. O inter- 
valo semi-interquartílico e a amplitude entre os centis 10-90 foram planejados para 
melhorar a amplitude total, mediante a eliminação dos casos extremos. 


2. Determinar a amplitude total das alturas dos estudantes da 
Universidade XYZ, apresentada na Tabela 2.1, pág. 43. 


Solução: 


Há duas maneiras para definir a amplitude total para os dados agrupados. 


1.º método: 


Amplitude total = ponto médio da classe mais elevada -- ponto médio da 
classe mais baixa = 186,5 — 154,5 = 32 cm. 


2.º método: 


limito superior verdadeiro da classe mais elevada — li~ 
mite inferior verdadeiro da classe mais baixa = 190,5 — 
— 150,5 = 40 cm. 


Amplitude total 


O 1.º método tende a eliminar, de certo modo, os casos extremos, 


'O desvio médio 


3. Determinar o desvio médio dos conjuntos de números do 
Probl. 1. 


Solução: 


(a) Média aritmética =Ñ = 
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Eix 


Desvio. Médio = D. M. = 


2,5146- 9.547951 +13 — 9,5! +16 9,5 +10 9,5] +18 9,51 +15 -9,5 


8 
25 +33 +25 105 +55 LOS +85+45 34 
; = caos. 
8 
(6) Média aritmética = X = LIS tE+SE + a pa Ei z -9, 
Desvio Médio = D. M, = AL=HL. 
N 
orla ol + ls 9l rig - ol + lo -ot +is ollo — ol +i -9] 
E - 
QHGLIHIHOAL+OALS 
6414 t LOEO gg, 


O desvio médio indica que o conjunto (b) apresenta dispersão menor do 
que (a). i 


4. Determinar o desvio médio das alturas dos 100 estu- 
dantes do sexo masculino da Universidade XYZ (veja a Tabela 3.2, 
pág. 86) 

Solução: 

Na solução do Probl. 20, Capítulo 3, foi determinada: 

Média aritmética = X = 171,70 em. 


A operação pode ser disposta coma na Tabela 4,1. 


Tabela 4.1 
T 
Alturas ` | Ponto Médio | |X — X| = [X — 171,70] Fregiiêncialf|X -F| 
(em) x | Í 
151 — 158 154,5 17,2 
159 — 166 162,5 9,2 
167 — 174 170,5 12 
175 — 182 178.5 6,81 
183 — 190 186,5 14,8 
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BX-X _ 8040 


Desvio Médio = D.M. = -~ = 6,04 cm. 


E; N “300 


É possivel idealizar um método abreviado para calcular o desvio médio 
(veja o Probl. 47). 


5. Determinar a percentagem das alturas dos estudantes do 
Probl. 4, que estão compreendidas nos intervalos: (a) X s: DM; 
(6) X + 2D.M.; (0) É + 8D.M, 

Solução: 
(a) X = D.M. = 171,70 + 6,04 é o intervalo de 165,66 cm até 177,74 cm. 


Êsse intervalo inclui todos os indivíduos da terceira classe + 1/8 (166,50 — 
— 165,06) dos estudantes da segunda. classe + 1/8 (177,74 — 174,5) dos da quarta 
classe (visto que a amplitude do intervalo de classe = 8 em; o limite superior 
verdadeiro da 2.º classe = 166,50 e o limite inferior verdadeiro da 4.º classe = 
= 174,5). 


O número de estudantes do intervalo X 4 D.M. é: ho 


42 + as (8) + aa (27) = 42 + 1,80 + 10,04 = 54,83 ou 55, 
que é 55% do total. 


(6) X + 2D.M. = 171,70 + 2 (6,04) = 171,70 +Æ 12,08 é o intervalo de 
159,62 cm até 183,78 em. 


O número de estudantes do intervalo É «+ 2 D.M. é: 


18- (2 z 1596) 19) Las Ao + (227 58240) 8 = 85,76 ou 88, 


que é 86% do total. 


(0) X +3D.M, = 171,70 8 (6,04) = 174,70 & 18,12 é o intervalo desde 
153,58 em até 189,82 cm. 


O número de estudantes no intervalo X  8D.M. é: 


(188 ASS) (5) pag 442 4.274 (18 18280 1 9) = 97,40 0u 97, 


„que é 97% do total. 


Amplitude semi-interquartílica ou desvio quartílico 


6. Determinar a amplitude sêmi-interquartílica da distribuição 
das alturas dos estudantes da Universidade XYZ (veja a Tabela 4-1 do 
Probl, 4). 


120 ESTATÍSTICA 


` Solução: 


O primeiro e o terceiro quartis são: 


Qi = 166,5 + 20s = 166,5 + 0,38 = 166,88 cm, 
Qs = 1745 + 2 = 174,5 + 2,96 = 177,46 em. 


A amplitude semi-interquartílica ou desvio quartílico é: 


Q = 3 (Qs — 01) = $ (177,46 — 166,88) = 5,29 em. 


Note-se que 50% dos casos estão compreendidos entre Q; e Qs, i. e. 50 estu-. 


dantes têm alturas compreendidas entre 166,88 em e 177,46 em. 


Pode-se considerar HQ» + Qs) = 172,17 cm como uma medida da tendência 
central, i. e., como & altura média, Segue-se que 50% das alturas estão situados 
no intervalo (172,17 = 5,29) em. 


7. Determinar a amplitude semi-interquartílica para os sa- 
lários dos 65 empregados na Companhia P & R (veja o Probl. 3, 
Capitulo 2, pág. 52). 


Solução: 


solução do Probl. 44,. Capítulo 3, foram -determinados Q; = Cr3 6 825- 
Cr$ 9 075. 


Então, a amplitude semi-interquartilica Q = $ (Q; — Qı) = $ (Cr$ 9 075 — 
— Cr$ 6 825) = Cr$ 1 125. ` 


Visto que (Qi + Q) = Cr$ 7 950, podemos concluir que 50% dos em- 
pregados recebem salários situados no intervalo Cr$ 7 950 = Cr8 1 125, 


À amplitude entre os percentis 10-90 


8. Determinar a amplitude entre os percentis 10-90 das alturas 
dos estudantes da Universidade XYZ (veja a Tabela 2.1, pág. 43). 


Solução: 


Nesse caso, Pio = 158,5 +a =160,72 cm e Po =174,5 +5005) -` 


= 181,90 cm. 

Então, a amplitude entre os percentis 10-00 = Peo — Pio = 181,90 em — 
~ 160,72 em = 21,18 em. 

Como HP + Poo) = 171,31 em e (Poo — Pio) = 10,59 em, pode-se concluir 
que 80% dos estudantes têm alturas situadas no intervalo (171,31 = 10.59) em. 
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O desvio padrão 
* 9. Determinar o desvio padrão de cada um dos conjuntos de 
números do Probl. 1. : 
Solução: 
(a) Média aritmética 
2x 12 +6+7+3 +15 +10 +18+5 76 


K= r 8 a 795, 
eg BRR 
ta N 


8” 


qera astro 0 aço asi ga gare — 9,5)? um 


= V 23,75 = 4,87. 


9J+3+8+8+O9+B+H9+IS 2 


8 ss» 


(b) Média aritmética = X = 


oa Z- = 
+= NO. 


PEE E += 9» a 
` p sé u aemp Da - and - datas ta a teta 1a 
= V I5 =387. 


Os resultados acima poderiam ser comparados com os do Probl. 3. No- 
tar-se-ia que o desyio padrão indica que o conjunto (b) apresenta dispersão menor 
do que a do conjunto (a). Entretanto, o efeito é disfarçado pelo fato dps valores 
exiremos afetarem muito mais o desvio padrão do que o médio, Isso era esperado, 
naturalmente, porque os desvios são clevados ao quadrado no cálculo do desvio 
padrão. 


10. Determinar a variância dos conjuntos de números do 
Probl. 1. 

Solução: 

Variância = $, Então, em vista do Probl. 9, tem-se: (a) $ = 23,75; 
(b) 52 = 15. 


23. Determinar o desvio padrão das alturas de 100 estudantes 
do sexo masculino da Universidade XYZ (veja a Tabela 2.1, pág 27). 
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Solução: 


Nos Probls. 15, 20 ou 22, do Capítulo 3, determinou-se X = 71,70. O tra- 
balho pode ser disposto como na Tabela +.2, abaixo, E 


Tabela 4.2 

a T 

Akura | Ponto | X -X = X -171,70 X-F} | Fregüên- | / (X — X? 
(em) | Médio X cia f 

- 181—158] 154,5 -172 | al 5 1 479,20 
1590-1606] 162,5 - 92 84,64 18 1 523,52 
167179] 170,5 - 12 1,44 42 60,48 
175—182| 178,5 6.8 46,24 27 1 248,48 
183--190] - 186,5 f 14.8 219,04 1 752,32 

= ii 
= 2j = |j (X-X? = 

= 6 064 


x 
ES! 


-7 ; 
e (E ti a Xy E e 60,64 s18 em. 


Cálculos do: desvio padrão de dados agrupados 


12. (a) Provar que s = EG = 


(b) Usar a fórmula de (a) para determinar o desvio padrão do 
conjunto dos múmeros 12, 6, 7, 3, 15, 10, 18, 5 


Solução: 


(a) Por definição: 


Então: ` i 
a X-X} EQ -2EX+R) EX 2REX A NR 
na N = N = N E 
20 ppm Pop R- =z 
= - 9% N +E x -2 4P = -X= 


Te 


ou 
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Note-se que, nos somátórios acima, foi adotada a forma, abreviada, em que 
N 


X substitui X; e 2 substitui z - 
j=1 
Outro método: 


è = (X — ZY = X? -2X3 + © = X - TEAR = 
=X — XE e E o RP. 


BO UM + (OP + (+ BY + (15) + OP + 08t (6% 
Ra = Ss = 


= 2 
8 =114, 
do PE EX 12 +46+7+3 +15 +10+18+5 76 
-7 5 igri 
Então: 


s=4/ F- X «1148-0025 = V 23,75 = 3,87. 


Este método pòde ser comparado com o do Probl. 9a). 


13. Modificar a fórmula do Probl, 120) para adaptá-la a fre- 
qüências correspondentes a vários valores de x.. 


Solução: 


A modificação adequada é: 


ZE (XY 
s- ZE- -VEE 


Ela pode ser estabelecida como no Probl. 12(a), partindo-se de: 


Era 
i N 


Então: 


rs 


2 ZAX -Ff _ ZX -2x +0) 2x -2X EX +Z 
N N = No o 


- IR -32E p- E 
N N 


qo 1 DJX ă g 
zay pp a AE e 
a N 


e ea 
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Note-se que, nos somatórios acima, foram adotadas as formas ‘abreviadas 


K 
nas quais X e f substituem X; e jj Z substitui Z se Zy =N. 


j=l jel 
34, Usando a fórmula do Probl. 13, determinar o desvio 
padrão dos dados do Probl. 11. 
Solução: 


O trabalho pode ser disposto como na Tabela 4.3. 


Tabela 4.3 
Altura (em) | Ponto Médio xX? JX 
X 
151 — 158 154,5 23 870,25 119 351,25 
159 —' 166 162.5 26 406,25 475 312.50 
167 — 174 170,5 29 070,25 1 220 950,50 
175 — 182 178,5 31 862,25 860 280,75 
183 — 190 186,5 34 782,25 278 258.00 
LjXº = 
2 954 153,00 


zjx (2y qas mens aAA a 0 
5 y NOTA) CY — (171,70) = 460,64 = 7,78 em. 


em que X = ZE = 171,70 em foi obtido no Probl. 15, Capítulo 3. 
Ì 


Note-se que ésse método, como o do Probl. 11, acarreta muitos cálculos 
cansativos. No Probl. 17, mostra-se como o método abreviado (desvio em valores) 
simplifica imensamente o cálculo. 


15. Sed=X-A é o desvio de cada valor de X,em relação a 
uma constante arbitrária A, provar que: 


Solução: 


Nisto que d=X-A; Xe 44d e Ñ=A +d, como no Probl 18, 
Capítulo 3, então: 


x-F=A+)-Ard=d-d, 
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de modo que 

a] RX- 4 EDERE ea 

ü N N ki N N 


usando o resultado do Probl. 13, com X e X substituídos por d e à, respecti- 
vamente. 


Outro método: 


Es (XXP = Q- IP = d odd + O? = 


os mi e Ee = 2 2 
=E-2qrie Roda EE Z4) 


Ks 


e obtém-se o resultado tomando a` raiz quadrada positiva. 


16. Mostrar que, se cada ponto médio X, em uma distribuição 
de frequência que tem amplitudes de intervalos de classe iguais a c, 
fôr expresso em função de um valor u, de acôrdo com a relação X = 
= A -$ c'u, em que A éum determinado ponto médio, então o 
desvio padrão poderá ser escrito como: 


E 


Solução: ` 


Esse expressão é deduzida imediatamente do problema, precedente, porque 
d= X- Á =cu Então, como c é uma constante, 


Outro método: 


Pode-se também demonstrar o resultado diretamente, sem usaro Probl, 15. 


Como X=4 +ou R=4 4a e X -— X =c(u — u), então: 


-OEY = du aF = d uu F u) = eu? = U? A T?) = qui?) 


2 t) 2 
N ` 
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17, Determinar o desvio padrão das alturas dos estudantes da 
Universidade KYZ usando: (a) a fórmula deduzida no Probl. 15; 
- (b) o método abreviado (desvio em classes) do Probl. 16. 


Solução: 


Nas Tabelas 4.4 e 4.5, abaixo, escolhe-se arbitràriamente A igual ao ponto 
médio 170,5 em. Note-se que, na Tabela 4.4, todos os desvios d = X — A são 
zaúltiplos do intervalo de classe c = 8. Esse fator é eliminado na Tabela 4.5. 
Em consequência, os cálculos, na Tabela 4.5, são grandemente simplificados. 
Éles poderiam ser comparados com os dos Probls, 11 e 14. Por essa razão, o 
método abreviado (desvio em classes) deve ser usado sempre que fôr possível. 


(a) Tabela 4.4 


Ponto Médio X |d=X'-— A | Fregiência j Ja jë 


N = Èj = 100 | È jd = 120 |2 j= 6 208 


: -q 7 Zie (Ee) e ( 120 
100 (ão 


= 462,08 — 1,44 = 7,78 em. 


(b) Tabela 4.5 
Ponto Médio x[ um da Freqiiência | ju Ju 
154,5 — 2 5 = 10 20 
162,5 e é 18 — 18 18 
A + 170,5 0 42 o 0 
178,5 1 2 27 2 
186,5 2 8 16 32 
Y = Zj = 100 | Bju =15 | Zp? = 


ae o E -EY -= 7 [BY TR 
sme =8 Yi e) = 80,9475 = 7,78 om. 
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18. Determinar: (a) a média; (b) o desvio padrão da distribuição 
dos salários de 65 empregados da Companhia P & R, usando o método 
abreviado (veja o Probl. 3, Capítulo 2). 


Solução: a 


Q trabalho pode ser disposto simplesmente, como na Tabela 4.6. 


Tabela 4.6 
x u j ju pë 
Cr$ 5 500 -2 8 - 16 32 
r 6 500 -1 10 — 10 10 
A — 7 500 o 16 0 0 
8 500 1 14 14 14 
9 500 2 10 20 40 
10 500 3 5 15 45 
11 500 4 2 8 32 

N = Èf = 65 | Djus 31 | Ep? = 173 


až = Atot aeb =Cr$ 7 500 + (C8 1 000) ( ŽE a Cr$ 7977. 


O) s=- «SÉ. (ZEY =s 1002 - E- 


= (Cr$ 1 000) V 2,4341 = Cr$ 1 560. 


19. A Tabela 4.7 apresenta os C.I. de 480 escolares de certa 
escola primária. Determinar: (a) a média; (b)' o desvio padrão, usan- 
do o método abreviado (desvio em classes). 


Tabela 4.7 


Valor centra? X| 70 74 78 82 86 90 94 98 102 106 110 114 118 122 126 
Frequência f fá 9 16 28 45 66 85 72 54 38 27 18, 11 5 2 


Solução: 
idade mental 


ici i igênci = em era xpresso em per- 
O coeficiente de inteligência C.I idade cronológica > expresi pi 
centagem. 
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Por exemplo, uma criança de 8 anos que, de acôrdo com certo processo edu- 


cacional, tem mentalidade equivalente a uma de 10, teria C, I. = 10/3 = 1,25 = 
= 125%, ou simplesmente .125, ficando subentendids a percentagem. 

Para determinar a média e o desvio padrão dos C. I., pode-se dispor o trabalho 
como na Tabela 4.8, 


Tabela 4.8 


x y Í ju h 
70 6 4 — 24 nda 
n 5 9 = 45 225 
78 4 16 De Er 
= 3 28 ~ 84 252 
E H ba — 90. 186 

+ 90 1 66 Nao 86 
A — 94 0 85 o 6 
98 1 72 72 7” 
102 2 54 108 216 
106" 3 38 14 342 
110 4 27 108 Es 
e 5 13 90 450 
118 6 1 66 306 
126 7 5 35 245 
126 8 2 16 198 

N = Zj = 480 | Eju = 236 pare 3404 


236) 
=94 +4 (E 480) = 95:97. 


Bju 
N 


la) E = =A to t=aA--c 


O) s= oV uu m eq Zg k (ey z 


naal 8408 ( 236 y STE 
E ag o Vamo) = 4Y 58409 = 10,47. 


Contrôle de Charlier 


20. Usar o contrôle de Charlier para auxiliar 2 variação dos 
cálculos: (a) da média; (b) do desvio padrão, efetuados no Probl. 19. 

Para proporcionar o contrôle pedido, somam-se as colunas da Ta- 
bela 4.9, abaixo, às da Tabela 4.8, com excessão da coluna, 2, que é 
repetida por conveniência. 
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Solução: 
(a) Eju + 1) = 716, da Tabela 4.9, abaixo. 
Bju +N = 236 + 480 = 716, da Tabele 4.8, scime, 
Issò proporciona o contrôle pedido para e média. 
(b) Eju + 1) = 4356, da Tabela 4.9, abaixo. 
Ef + 2EjutN=3 404-+2(236) 4480 = 4356, da Tabela 4.8, acima. 


Isso proporciona o contrôle pedido pera o desvio padrão. 


Tabela 49 
1o 
u+1 Hu + 1) 
— 2 100 
zi - 38 144 
Z3 -48 144 
a - 56 112 
E -45 45 
E 0 0 
H 85 i 85 
2 144 .288 
z 162 486 
$ 152-- 2150608: aid pis 
5 135 675 
E 108 648 
A 77 539 
3 40 320 
1 
9 18 
Z ju -+ 1) = 716 [Bju + 1 = 4356 


Correção de Sheppard para a variância 


21. Aplicar a correção de Sheppard para determinar o desvio 
padrão dos dados do: (a) Probl. 17; (b) Probl. 18; (c) Probl, 19. 


Solução: 
(a) 5? = 60,58; c = 5. Variância corrigida = s? — cè]12 = 60,58 — 8°/12 = 
= 60,58 — 5,33 = 55,25. 


Desvio padrão corrigido = 


variância corrigida = 55,26 = 7,43 em. 


E 
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(b) s? = 2434 100;c = 1 000. Variância corri ida = s? —¢°/1 
— 198/12 = 2 350 800. s EERE eM 


Desvio padrão corrigido = 4/2350 800 = Cr$ 1 533. 


(0) = 109,60; c = 4, Variância corrigida = s? — ¢?/1; e 3/12 = 
Ato E c?/12 = 109,60 — 4%/12 = 


Desvio padrão corrigido = V 108,27 = 10,41. 

22. Para a segunda distribuição de freqüência do Probl. 8, Ca- 
pítulo 2, pág. 55, determinar: (a) a média; (b) o desvio padrão; (c) o 
desvio padrão; usando a correção de Sheppard; (d) os desvios padrões 
reais para os dados não agrupados. 


Solução: 


O trabalho está disposto na Tabela 4,10. 


Tabela 4.10 

61,0 -3 3 9 2 
-= 7 
65,5 —2 5 — 10 20 
70,0 ER 9 2% q 
4— 745 o 9 o K 
79,0 1 5 % $ 
83,5 2 4 8 16 
88,0 3 2 6 18 

T 
N =j = 40 | Sju = 9| Eju 
(a) B=Atot= Ape Ss =L 
N 5 5 Uo 75,51 kg 


(b) 


2e (Y - 


2 
) = 4,5 V 2,324375 = 6,86 kg. 


(c) Variância corrigida = $? — c?/12 = 47,06 — 4,5?/12 = 45,38. 
Desvio padrão corrigido = 13,5 lb. 
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(à) Para calcular o desvio padrão em relação nos pesos reais dos estudantes, 
dados no problema, é conveniente, primeiramente, subtrair um número apropria- 
do, como À = 75 kg, de cads pêso,e, então, usar o método do Probl. 15. Os 
desvios d = X — A = X — 75 estão apresentados na seguinte tabela: 


-6 7 q -9 -3 -1245 — 05 3,5 


-2 4 =$ —1,5 -7 = 1 1 -3 
9 — 12 —6 13 8,5 —-13,8 2 7,5 

-2 . 125 -4 -15 -75 -15 -5 -76 
5,5 — 25 -75 -4 0 3 — 25 ~ll 
Dêles determinamos Id = — 64 e Ed =1763. Então: 


= 


se (Hy. 17 (Ge 
No. N : 40 
= vV 41,51 = 6,43 kg. 
Portanto, a correção de Sheppard proporciona alguma vantagem neste caso. 


Relações empíricas entre as medidas de dispersão 


23. Discutir a validade das fórmulas empíricas. 


(a) Desvio médio = 4/5 (desvio padrão). 
(b) Amplitude semi-interquartílica = 2/3 (desvio padrão), para 
as distribuições das alturas dos estudantes da Universidade XYZ. 


Solução: 


desvio médio 574 am 
ta) Dos Probla: 4e 1l, desvio padrão ~ 7,42 0,77. 


amplitude semi-interquartílica 503 088. 


desvio padrão . 7,42 


{b) Dos Probls. 6 e 11, 


Em conseégiiência, as fórmulas empíricas são válidas nestes casos. 


Nora: Não se usou o desvio padrão com a correção de Sheppêrd pera o 
grupamento acima, porque nenhuma correção correspondente foi feita para o des- 
vio médio e a amplitude semi-interquartílica. 
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“Propriedades do desvio padrão 


24. Determinar a percentagem dos C.I. dos estudantes, do 


“ Probl. 19: que estão situados nas faixas, (a) X +s; (b) Ž + 2s; 
te) X = 3s. 
Solução: 
la) X s = 95,97 + 10,47 é o intervalo dos C.I. de 85,5 a 106,4. 


O número de C.I. nesse intervalo (X + s) é: 


(E e) (45) +66 +85 +72 454 + (e (38) = 339. 
À e 339 
Percentagem dos GI. no intervalo X Æ s = Js 7 70,6%. 


(b) F + 2s = 95,97 = 2(10,47) é o intervalo dos Č.J. de 75,0 a 116,9. 
O número de C.Y. nesse intervalo (X Æ 28) é: 


(EO) o) pas +28 as +66 +85 + 724644085 + 
+27 +18 + (Venus) a1) = 451. 


Percentagem dos C.I, no intervalo (X + 2s) = 5 = 94,0%. 


(0) X + 3s = 95,97 + 3 (10,47) é o intervalo dos'C.I. de 64,6 a 127,4. 


O número de C.i. nesse intervalo (X = 3s) = 480 — (ms) = 
= 479,7 ou 480. 


479,7 


Percentagem dos C.I. no intervalo (X = 35) = “480” 


camente, 100%. 
As percentagens de (a), (b) e (c) concordam favorâvelmente com as esperadas 
em uma distribuição normal, i.e., 68,27%, 95,45% e 99,73%, respectivamente, 
Note-se que não se usou 2 correção de Sheppard para o desvio padrão. Se 
ela fôr usada, o resultado, neste caso, concordará, muito aproximadamente, com 
o acima. Repare-se que o resultado acima pode, também, ser obtido mediante o 
emprêgo da tehela do Probl- 32. 


= 99,9 % ou, práti- 


25. Dados os conjuntos de números 2, 5,8, 11, 14 e 2,8, 14, 
determinar: (a) a média de cada conjunto; (b) a variância de cada con- 
junto; (c) a média dos conjuntos combinados ou “reunidos”; (d) a 
variância dos conjuntos combinados ou reunidos. 
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Solução: 
(o) Média do 1.º conjunto: = 1/5 (2 +5 +8 -+11 +1) = 8. Média do 
2º conjunto: = 1/3 (2+ 8 + 14) = 8. 
. (b) Variância do 1.º conjunto: = sê = 1/512 — 8} + (5-8 + (8-8 + 
+01 — sp + (14 — 8f) = 18. x 


Variância do 2.º conjunto: = s2 = 1/3 (2 — SÈ + (8 — BP + (14 — 8] 


ii 


2445+841 +U+2+8+14 
5+3 


(c) Média dos conjuntos combinados: 


(d) Variância dos conjuntos combinados: 


à = Lt (5-8) + (8-8) + (11-8) + (14-8) + (2-87 + (8-3 + 04-8? À 
zi 5+3 


= 20,25. 
Outro método, pelo emprêgo da fórmula: 


Variância do conjunto combinado = $ = a; 
— 15) 08) +) 09) 
RE a DIREI E E 


26. Resolver o problema precedente, para os conjuntos de nú- 
meros 2, 5, 8, 11, 14 e 10, 16, 22. 


Solução: 


Agora, as médias. dos dois conjuntos são 8 e 16, respectivamente, enguanto 
que as variâncias são iguais às dos conjuntos do problema anterior, & saber: 
sê =18 e sy = 24. 
24+5+84+11 +14 +10 +16 422 

5+3 


Média dos conjuntos combinados: = 
= li. 
Variância dos conjuntos combinados: 


27 CADENA GI PAI AA PAO MP H1622 
E i 5+3 


= 35,25. 
2 e “om 
Note-se que a fórmula $ = Hitas, me dá o valor 20,25, não é 
Ni ? 


aplicável a êste caso, porque as médias dos dois conjuntos não são igueis. 
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27. (a) Demonstrar que w? + pw + q, em que p e q são cons 


tantes dadas, apresenta um valor mínimo sômente andat =- 4p. 


x > (Z; = a)? 
(è) Tendo em vista. (a), demonstrar que é 
DX ~a)? N o? 
( a) 
abreviadamente mm » tem o valor mínimo sômente quando 
a = X. 


ou 


Solução: 
. 2 
(0) Temse u? +pota= (ut fo) +a- Fp Como (a- 17º) 


é ums RE a expressão atinge seu menor valor (i.e, é um mínimo) sômente 


quando w + 7 > p=0, Le w= dp. 
6) E(X- af  L(X = uX ta) EX -2 EX + Na 
N N N i 
sg uze 


A comparação dessa última expressão com (w? + pw + q), conduz. a w = a, 


2x 2x? 
E Qi e 


Então, a expressão tem valor. mínimo quando a = — + p= 22 =J, 


segundo o resultado do item (a). 
Dispersão absoluta e relativa. Coeficiente de variação 


28. Uma indústria de válvulas de televisão tem dois tipos de 
válvulas, 4 e B. As válvulas têm as durações médias de X4 = 1495 
horas e. Xp = 1 875 horas, respectivamente, e os desvios padrões de 
sa = 280 horas e sa = 310 horas. Quala válvula que tem maior: 
(a) dispersão absoluta; (b) dispersão relativa ? 


Solução: 
(a) Dispersão absoluta de 4 = s4 = 280 horas; de B = sp = 310 horas. 
Então, a válvula B tem maior dispersão absoluta. 


(b) Coeficiente de variação de A = xá = a = 18,7%; de B = = = 
AB 
+ 810 
g = g 
1875 165% 


Então. a válvula Æ tem a maior variação ou dispersão relativa. 
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29, Determinar os coeficientes de variação V pera os dados: 
(a) do Probl. 14; (b) do Probl. 18, utilizando os desvios padrões 


não corrigido e corrigido. 


Solução: 
a s (não corrigido) 7,78 Es 
(a) YV (não corrigido) = DF O “TOS 0,0453. 
Y (corrigido) corrido) m H + 0,0433, segundo o Probl, 
2tiu). 
R > (não corrigido) = VPL CENBCOL pio es 0,196 = 7 
{b} V (não corrigido) Cr$ 7077 0,196 = 10,0%, 


s (corrigido) 5 Cr$ 1538 = 0,192 = 19,29%, së- 


Y (corrigido) x Cr8 7977 


gundo o Probl. 21(b). 


30. (a) Definir uma medida de dispersão relativa que possa ser 
usada para um conjunto de dados, cujos quartis. sejam conhecidos. 
(b) Exemplificar o cálculo da medida definida em (a), usando os dados 
do Probl. 6. 


Solução: 

(a) Se Qie Qi são conhecidos para um conjunto de dados, então FQ + Qe) 
é uma medida da tendência centrai ou média dos dados, enquanto que 
Q = HQs — Qi), a amplitude semi-interquartílica, é uma medida da dispersão dos 


dados. 
Pode-se, então, definir, para medida da dispersão relativa, 


vae aQ) Onda, 
2 (Qa + Qa) Qu +Q 
que pode ser denominado coefiriente quariílico de variação ou de dispersão relativa. 


nA = 177,46 — 166,88 _ 1058 ETA 
a EQ, O 17746 + 166,88 244,34 = 0,0433 = 4,8% 


b) Fi 


Variável reduzida e escores reduzidos 


31. Um estudante recebeu grau 84 em um exame final de Mate- 
mática, para o qual o grau médio foi 76 e o desvio nadrão 10. No 
exame final de Física, para o qual o grau médio foi 82 e o desvio pa- 
drão 16, êle recebeu o grau 90. Em que matéria sua posição relati» 
foi mais elevada ? 
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Solução: ` 
; ` a-f : aen 
A variável reduzida z = EE SO mede o desvio de X em relação a X, em 
têrmos de desvio padrão s. 
Para Matemática, z = sito = 0,8. Para Física, z = 2-2 
Dessa forma, o estudante teve grau correspondente a 0,8 do desvio padrão 
acima da média, em Matemática, mas apenas o correspondente a 0,5 do desvio 
padrão acima da média, em Física. Assim, sua posição relativa foi mais alta 


em Matemática. 


= 0,5. 


5 x-9 7 Rica 
A variável z = EA 6 frégiientemente usada em testes educacionais, 


onde é conhecida como escore reduzido. 


32. (a) Converter os C.I. do Probl. 19 em escores reduzidos. 
(b) Construir um gráfico da frequência relative em função do escore 
reduzido, 


Solução: . 

(a) O trabaiho-de conversão em escore reduzido pode ser disposto como na 
Tabela 4.11. Nessa tabela adicionaram-se, para empregá-lo no item (b), os pontos 
médios dos C.I. 66 e 130, que têm frequência nula. Também não se usou a 
correção de Sheppard para o desvio padrão. Os escores corrigidos neste caso 
são praticamente iguais aos aqui apresentados para a aproximação indicada, 


Tabela 4.11 X = 96,0, s = 10,5 


Fregiiência 

C.I. (X) X- z = = | Fregiiência f relativa 

i $ HN (%) 
66 —30,0 —2,86 9,0 
70 — 26,0 —2,48 0,8 
74 —220 —210 19 
78 18,0 ag fra 3,3 
82 ~14,0 —1,38 5,8 
86 —10,0 9,4 
90 — 6,0 -0,57 13,8 
94 — 20 —0,19 17,7 
98 20 15,0 
102 6,0 11,2 
106 10,0 7,9 
110 14,0 56 
114 18,0 3,8 
118 22,0 2,3 
122 26,0 1,0 
126 30,0 0,4 
130 - 34,0 0,0 
100% 
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db) O gráfico da fregiiência relativa em função do escore z (polígono de 
fregiência relativa) cstá indicado na Fig. 4-2, O eixo horizontal está graduado 
em unidades de desvio padrão s. Note-se que a distribuição é moderadamente 
assimétrica e ligeiramente desviada à direita. 


Frontôncia Relativa (%) 


+ 


o. 


Fig. 4-2 


-3 -2 - 


Problemas Suplementares 


A amplitude total 


33. Determinar a amplitude total dos conjuntos de números: (a), 5, 3, 8, 4, 
7, 6, 12, 4, 3; (b) 8,772, 6,453, 10,624, 8,628, 9,434, 6,351. 


Resp.: (a) 9; (b) 4,273. 


34, Determinar a amplitude -total-das cargas máximas apresentadas.-na. .... 


Tabela 3.8, Probl. 59, Capítulo 3. 

Resp.: 4t. 

35. Determinar a amplitude total dos diâmetros das cabeças de rebites da 
Tabela 3.10, Probl. 61, Capítulo 3. 

Resp.: 0,0036 polegada. 

56. A maior de 50 medidas é 8,34 kg. Sea amplitude total é 0,46 kg, de- 
terminar a medida menor. 

Resp.: 7,88 kg. 

37. Determinar a amplitude total dos dados do: (e) Probl. 62, Capítulo 3; 
(b) Probl. 73, Capítulo 3; (c) Probl. 20, Capítulo 2. 

Resp.: (a) 35; (b) indeterminada; (c) 900 horas. 


O desvio médio i 
Ê 38. Determinar o valor absoluto de: (a) — 18,2; (b) +3,58; (e) 6,21; 
(0) 0 O = VB q) 4230-852. 2 

Resp: (a) 18,2; (b) 3,58; (e) 6,21; (d) 0; (e) 2 = 1,414 aprox; Q) 
1,88. 
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39. Determinar o desvio médio dos conjuntos de números: (e) 3, 7, 9, 5; 
(b) 2,4, 1,6, 3,8; dl, 3,4. 
Resp: (a) 2; (b) 0,85. 


40. Determinar o desvio médio dos conjuntos de números do Probl. .33. 
Resp: (a) 22; (b) 1,817. 


ay. "Determinar o desvio médio das cargas máximas da Tabela 3.8, Probl. 59, 
Capítulo 3. i 


Resp: 0,578 t. 


42. (u) Determinar o desvio médio (D.M.) dos diâmetros dás cabeças dos 
rebites da Tabela 3,10, Probl. 61, Capítulo 3. (b) Qual as percentagens dos diá- 
metros das enbeças de rebites compreendidos entre (É+DM.), (É +2D.M.), 
E 3 DM)? 

Resp.: (a) 0,00437 polegada; (b) 60%, 85,2%, 96,4%. 


43. Determinar o desvio médio: (a) em relação à média; (b) em relação 
à mediana, do conjunto de números 8, 10, 9, 12, 4, 8, 2. Verificar que o desvio 
médio em relação à mediana não é maior do que em relação à média. 


Resp: (a) 30; (b) 28. 


44. Determinar o desvio médio: (a) em relação à média; (b) em relação 
à mediana, para a distribuição do Probl, 60, Capítulo 3. Usar o resultado 
dêsse problema e, também, o do Probi. 70, Capítulo 3, 


Resp: (a) 31,2; (b) 30,6. 


45. Determinar o desvio médio: (a) em relação à média; (b) em relação 
à mediana, para a distribuição do Probl. 62, Capítulo 3. Usar o resultado 
dêsse problema e, também, o do Probl. 72, Capítulo 3. i 


Resp: (a) 6,0; (b) 6,0. 


46." Explicar por que o desvio médio é ou não uma medida adequada da 
dispersão, para a distribuição do Probl. 73, Capítulo 3. 


47. Deduzir fórmulas abreviadas de desvios em classes para calcular o 
desvio médio: (a) em relação à média; (b) em relação à mediana, pars uma 
distribuição de fregiiência, Aplicar essas fórmulas para verificar os resultados 
dos Probls. 44 e 45. k 


Amplitude semi-interquartílica ou desvio quartílico 


48, Determinar a amplitude semi-interquartílica, para as distribuições do: 
(a) Probl. 59, Capítulo 3; (b) Probl. 60, Capitulo 3; (c) Probl. 107, Capítulo 3. 
Interpretar claramente os resultados, em cada caso. 


Resp: (a) 951%; (Bb) 27,0; (e) 12 
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49. Determinar a amplitude semi-interquartílica para as distribuições do: 
(a) Probl, 31, Capítulo 2; (b) Probl. 73, Capítulo 3, Interpretar claramente 
os resultados em cada caso. Explicar as vantagens da amplitude semi-interquar- 
tílica para êsses tipos de distribuição em relação às outras medidas da dispersão, 
Resp: (a) US$ 1801; (b) 10,8 anos. 


50. Provar que, para qualquer distribuição de fregiiência, a percentagem 
dos casos compreendidos no intervalo HO + 09) HO — Qu) é de 50%. 
Essa proposição é verdadeira para o intervalo Qa + 03 — QU? Explicar a 
resposta, 


52. (a) Como se interpretaria graficamente a amplitude semi-interquarti- 
lica, correspondente a uma certa distribuição de frequência? (b) Qual é a corre- 
Jação entre a amplitude semi-interquartílica e a ogiva da distribuição ? 


Amplitude entre percentis 


52. Determinar a amplitude entre os percentis 10-90 para as distribuições 
de: (a) Probl. 59, Capítulo 3; (b), Probi. 107, Capítulo 3. Interpretar claramente 
os resultados, em cada caso. 

Resp: (a) L63t; (b) 33,6 ou 34, 


53. Determinar a amplitude entre os percentis 10-90, para as distribuições 
do: (a) Probl. 31, Capítulo 2; (b) Probl. 73, Capítulo. 3. Interpretar clara- 
mente os resultados em cada caso. Qual a vantagem que à amplitude entre 08 
percentis 10-90 apresenta sôbre as outras medidas de dispersão? Qual a des- 
vantagem? 

Resp.: (a) US$ 7402; (b) 40,8. 


54. Que vantagens ou desvantagens apresentaria uma amplitude entre 08 
percentis 20-80, comparada com à determinada para os percentis 10-90? 


55. Responder ao Probl. 51 com referência à: (a) amplitude entre os per- 
centis 10-90; (b) amplitude entre os percentis 20-80; (c) amplitude entre 
os percentis 25-75. Qual éa correlação entre a resposta ao item (c) e a ampli- 
tude semi-interquartílica ? 


O désvio padrão 

56. Determinar o desvio padrão dos números: (a) 3, 6, 2, 1 7,5; 632, 
4,0, 28, 5,2, 4,4; (0)0,0,0,0,0,1, 1,1. 

Resp: (a) 2,16; (b) 0,90; (c) 0,484. 


57. (a) Somando-se 5 a cada um dos números do conjunto 3, 8,2, 1, 7,5, 
obtém-se o conjunto 8, 11, 7, 6; 12, 10. Mostrar que os dois conjuntos têm o 
mesmo desvio padrão, mas médias diferentes. Qual é a relação entre as médias ? 
(b) Multiplicando-se cada um dos números 3, 6, 2, 1,7, 5 por 2 e depois soman- 
do-se-lhes 5, obtém-se o conjunto 11, 17, 9, 7, 19, 15. Qual é a correlação entre 
os desvios padrões e as médias de ambos os conjuntos? (c) Quais as propriedades 
de médis. e do desvio padrão que são exemplificadas pelos conjuntos particulares 
de números dos itens (e) e (6)? 4 
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58. Determinar o desvio padrão do conjunto de números da progressão 
aritmética 4, 10, 16, 22, ..., 154. 


Resp.: 45. 

59. Determinar o desvio-padrão para as distribuições do: (a) Probl. 59 
Capítulo 3; (b) Probl. 60, Capítulo 3; -(c) Probl. 107, Capítulo 3. 

Resp.: (a) 0,733 t; (b)38,60; (c) 12,1. 


60. Demonstrar o emprêgo do Contróle de Charlier em cada item do 
Probl, 59. 


6l. Determinar: (a) a média; (b) o desvio padrão, para a distribuição do 
Probl. 17, Capítulo 2, explicando o significado dos resultados obtidos, d 

Resp: (a) Ẹ = 2,47; (b) s= 1,11. 

62. (a) Explicar por que o desvio padrão não é uma medida adequada da 


dispersão para-a distribuição do Probi. 31, Capítulo 2. (b) Que medida dé dis- 
persão poderia ser usada em seu lugar? Ilustrar a resposta. . E 


63. (a) Determinar o desvio padrão s dos diâmetros das cabeças de rebites 
da Tabela 3.10, Probl. 61, Capítulo 3. (b) Que percentagens dêsses diâmetros 
estão situadas entre" (X :t s), (X = 25), (X + 35)? (e) Comparar -as percen- 
tagens do item (b) com as que seriam esperadas, tedricamente, se a distribuição 
fôsse norma: e dar as razões de quaisquer diferenças observadas. 


Resp: (a) 0,000576 polegada: (b) 72,1%, "933%, 99,76%. 

64. Aplicar a correção de Sheppard a cada desvio padrão do Probl. 59. 
Em cada caso, discutir se essa aplicação é ou não justificada. 
Resp.: (a) 0,719, (b) 38,24, (c) 11,8. 


65. Que modificações ocorrem no Probi, 63, quando são aplicadas as cor- 
reções de Sheppard ? 


Resp: (a) 0,000569 polegada; (b) 71,0%, 93%, 99,68%. 


66. (a) Determinar a média e o desvio padrão dos dados do Probl. 8, Ca- 
pítulo 2. (b) Construir a distribuição de frequência dêsses dados e determinar o 
desvio padrão. (c) Comparar o resultado de (b) com o de (a). Determinar se 
à aplicação da correção de Sheppard produz melhores resultados. 


Resp.: (a) 73,4 kg, 6,45 kg. 


67. Resolver o Probl. 66, com os dados do Probl. 27, Capítulo 2. 
Resp.: (a) 0,7349 polegada, 0,00495 polegada. Í 


68. (a) De um total de N números, a fração p é constituída de números i 
enquanto que a fração g = 1 — po é de zeros. Provar que o desvio padrão 
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dêsse conjunto de números é v Pq. (b) Aplicar o resultado do item (a) ao Probl 


i A f 
Og, (a) Provar que a variância de um conjunto de r.números a, a + d, a + 


j essã itmética com primeiro têrmo « 
2d, ..., a + (n — 1)då Ge, uma progressão aritmi a i 
ao razão d) € dada por 1/12 (nº — 1). (©) User o que foi estabelecido em (a) no 
Probl. 58, (Sugestão: Fazer 1 +2+3 +: tn- l= 18 nn 42 
+ H (n 1P = 1/6 n(n in DJ 


70. Gencralizar e demonstrar a propriedade 3 da påg.114. 


Relações empíricas entre as medidas de dispersão 


ji. Mediante a comparação dos desvios padrões obtidos no Probl. 59 com 
os desvios médios correspondentes dos Probls. 41, 42 e 44, detorminar se prevaleco 
a seguinte relação empírica: desvio médio = 4/5 do desvio padrão. Justificar 
quaisquer diferenças que possam ocorrer. `. 


72. Mediante 4 comparação dos desvios padrões obtidos no Probl, 59, wm 
as amplitudes semi-interquartílicas correspondentes do Probl. 48, yoi pà 
prevalece à seguinte relação empírics: amplitude semi-interquartílica = 2/3 do 
desvio padrão. Explicar quaisquer divergências que possam ocorrer. 


73. Que relação empírica poder-se-ia esperar que exista entre à amplitude 
semi-interquertílica e o desvio médio, para uma. distribuição em forma de sino 
moderadamente desviada ? 


Resp: Amplitude semi-interquertílica = 5/6 (desvio médio): 


. 74. Uma distribuição do frequência aproximadamente normal tem a are 
plitudo semi-intorquertítica igual a 10. Que valores se poderia esperar para: 
(a) o desvio padrão; (b) o desvio médio ? 


Resp: (6) 15; (D) 12 


Dispersão absoluta e relativa. „Coeficiente de variação 


75. Em um exame final de Estatística, o grau médio de um grupo de E 
estudantes foi 78 e o desvio padrão 8,0. Em Algebra, entretanto, o grau ps s 
final do grupo foi 73.e o desvio padrão 76. Em que matéria foi maior: 
dispersão absoluta; (b) a dispersão relativa ? 


Resp: (a) Estatística; (b) Álgebra, 


76. Determinar o coeficiente de variação dos dados do: 
Capítulo 3; (b) Probl. 107, Capítulo 3. 


Resp: (a) 66%; 4) 19,0%. 


(o) Probl. 58, 
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77. (a) Por que não é possível caleular o coeficiente de variação para a 
distribuição do' Probl, 3t, Capítulo 2? (b) Caleular o coeficiente quartílico de 
dispersão relativa dessa distribuição (veja o Probl. 108(c) do Capítulo 3, e tam- 
bém o Probl. 30). 


Resp: 61,9%. 


78. (o) Descrever uma medida de dispersão relativa que utilize a amplitude 


serni-interquartílica, (b) Exemplificar o cálculo dessa medida, usando os dados 
do Probl. 73, Capítulo 3, 


Variável reduzida e escore reduzido 


73, Nos exames referidos no Probl. 75, um estudante obteve os graus: 75 
em Estatístico e 71 em Álgebra. Em qual dos exarmes foi mais elevada sua posição 
relativa ? i 


Resp.: Álgebra, 


80. Converter o conjunto dos números 6, 2, 8, 7, 5 em escores reduzidos, 
Resp: 0,19; — 1,75; 1,17; 0,68; — 0,29. 


31, Provar que a média e o desvio padrão de um conjunto de escores redu- 
gidos são iguais a zero e a 1, respectivamente, Exemplificar, usando o Probl. 80, 


82. (a) Converter os graus do Probl. 107, Capítulo 3, em escores reduzidos. 
(b) Construir um gráfico da frequência relativa em função do escore reduzido. 


CarfruLo 5 


MOMENTOS, ASSIMETRIA E CURTOSE 


Momentos 


Se Xiu Xo ..., Xy são os N valores assumidos pela variável X, 
define-se a quantidade 


x 
mo rtt. AXN px aZ q 


x = N i N N 


denominada momento de ordem r, O primeiro momento, com r = 1, 
é a média aritmética X. A E 
O momento de ordem r centrado na média X é definido por: 


N E 
x (X; — XY (Z — xy 


jsi 


m, = N N 


=(X- x». (2) 


Se r = 1, m, = O (veja o Probl. 16, Capítulo 3). Ser = 2, Mma = 3%, 
a variância. 

O momento de ordem. r centrado numa origem qualquer À é defi- 
nido por: 


N 
a ES Ay E es Ay a 2i à Ela AY, | (3) 


em que d = X — A é o desvio de cada valor de X em relação a 4. 
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Se A = 0, (3) recai em (1). Por essa razão, (1) é muitas vêzes deno- 
minado momento de ordem r centrado na origem. 


Momentos para dados agrupados 


Se Xa, Xa ..., Xg ocorrem com as fregiiências fı, Ío sxa Ji 
respectivamente; os | momentos acima são dados por: 


= O PEER en EAE 3 S sy 


é N N Nº O 
K 
Dis z : 
f SELD o 

m = MÃO © 
K 
Do hE AY 

m’ = AE a ZKX-AY O aiy, ©) 


N N 
K i s 
em que N = p> J;= Èj. As fórmulas são apropriadas para cal- 
cular os momentos de dados agrupados. 


Relação entre. os momentos 


Existem as seguintes relações entre os momentos centrados na 
média, Mm, e os referidos a uma origem arbitrária my. 


Mm = M? — my? 
ma = my — Bmymy + 2m,” (7) 
“i 
' ma = mi — emma! + 6mm? — 3m! 


etc. (veja o Probl. 5). Note-se que m =X-— A. 
Cálculo dos momentos para dados agiupados 


O processo abreviado (desvio em classes) para o cálculo da média 
e do desvio padrão, exposto em capítulos anteriores, pode também 
ser empregado para proporcionar um método abreviado para o cálculo 
dos momentos. Esse método baseia-se no fato de ser X; = A + cu; 
(ou, abreviadamente, X = A + cu), de modo que, da Equação (6) 
se deduz: 


= ur (8) 
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que pode ser empregada para à determinação de m, mediante a 
aplicação das Equações (7). 
Contrôle de Charlier e correção de Sheppard 


Q contrôle de Charlier, para O cálculo dos momentos pelo pro- 
cesso - abreviado (desvios em classes), usa as identidades: 


Zju+I) =Eju +N 

juris Èj +r2Eju +N (9) 
Bju + e= Dj t3 Eju t3 Eju +N 

Eju D= Ef +46 +4Eju AN. 


As correções dé Sheppard -para os momentos (por extensão das 
idéias da pág. 115) são as seguintes: 


ma corrigido = M: - e ; 
sis lena 7 
ms corrigido = my — Ed ar “540º 


Os momentos mı e ma não necessitam correção. | 


Momentos- sob. forma abstrata 


Para evitar unidades particulares, podem ser definidos momentos 
abstratos centrados na média. 


mM m, m, ` 
Ls ti e mi (10) 
dae: (Vm y mt 


em que s= a/m, é o desvio padrão. Como mi =0 e m = 3, 
têm-se a = 0 e m= l. 


Assimetria 


Assimetria é o grau de desvio, ou afastamento da simetria, de 
uma distribuição. Se a curva de fregiência (polígono de frequência 
regularizado) de uma distribuição tem uma “eguda” mais longa à 
direita da ordenada máxima do que à esquerda, dii-se que a distri- 
buição é desviada para a direita, ou que ela tem assimetria positiva. 
Se é o inverso que ocorre, diz-se que ela é desviada para a esquêrda, 
ou que tem assimetria negativa. 
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Para distribuições assimétricas, a média tende a situar-se do 
mesmo lado da moda, que a cauda mais longa (veja as Figs. 3-1 e 3-2, 
Capítulo 3). Por isso, uma medida da assimetria é proporcionada pela 


diferença entre a médis e a moda. Ela pode ser tomada sem di-' 


. mensão mediante sua divisão por uma medida de dispersão, como 
desvio padrão, o que resulta na seguinte definição: 


média — moda X ~ moda 
desvio padrão J% ` 


` Assimetria = 


a1) 


Para evitar o emprêgo da moda, pode-se adotar a fórmula empí- 
rica (10) da pág. 75 e definir: 


Assimetria meee 


_8(média — mediana) | 3(X — mediana) (12) 
desvio padrão E s 


As duas medidas acima são denominadas, respectivamente, pri- 
meiro e segundo coeficientes de assimetria de Pearson. 


Outras medidas da assimetria, definidas em quartis e percentis, 
são as seguintes: 


Coeficiente quartílico de assimetria = 


QDO) QU 20 + Qi 
"Q Q; Ce MA 


Coeficiente de assimetria entre os percentis 10-90 = 


a (Prom Pro) — (Pro — Pro) Po 2PotPo. (14) 
Po — Pu Poo — Pio 


Uma medida importante da assimetria utiliza o terceiro momento 
centrado na média, expressa sob forma não-dimensional, e é definida 
por: 


Coeficiente do momento de assimetria = 
Ma Ma Ma 


a3 = 


PO aT V 


(15) 


Outra medida de assimetria é, às vêzes, definida por b; = as. 
Para uma cuiva perfeitamente simétrica, como a normal, a; e bı são 
nulos. 
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Curtose 


* Curtose é o grau de achatamento de uma distribuição, consi- 
derado usualmente em relação a uma distribuição normal. A distri- 
buição que tem um pico relativamente alto, como a da curva da 
Fig. 5-1(a), é denominada leptocúriica, enquanto que a da curva 


“da Fig. 5-1(b), que tem o tôpo achatado, é denominada platicúrtica. 


A distribuição normal, Pig. 5-1(c), que não é muito pontiaguda 
nem muito achatada, é denominada mesocúriico. 


ta) loptocóriico é (b) Platicartics (e) Meaocórtica 
Fig. 5-1 


Uma médida de curtose, baseada no quarto momento centrado 
na média, expressa sob forma não-dimensional, é definida por: 
4 


Coeficiente do momento de curtose = a; = E = =t (16) 
2 


e é, frequentemente, representada por be. Para a distribuição normal, 
bı = a =3. Por essa razão, a curtose é definida frequentemente 
por (ba — 3), que é positivo para uma. distribuição leptocúrtica, nega- 


“tivo para umá platicúrtica e nulo para uma normal, 


- Outra medida de curtose também empregada baseia-se nos 
quartis e percentis e é definida por: 


PE a7) 


Po — Pro 


em que Q = 3(04 — Q) é a amplitude semi-interquartílica. 

Ela é conhecida como coeficiente percentílico de curtose. Para a 
distribuição normal, seu valor ê 0,263 (veja o Probl, 14). 
Momentos, assimetria e curtose da população 


Quando é necessário distinguir os momentos e as medidas de 
assimetria e curtese de uma amostra dos correspondentes à popu- 


Í 
1 
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lação da qual a amostra é uma parcela, costuma-se fregientemente 
adotar símbolos latinos para a primeira e gregos para a última. 
Assim, se os momentos da amostra forem representados por m, e m;, 
os símbolos gregos correspondentes serão u, e uy (u é a letra grega 
mu). Os índices são sempre representados por símbolos latinos. 


Semelhantemente, se a medida de assimetria e a curtose da 
amostra forem representadas por à; € as, respectivamente, as corres- 
pondentes da população serão representadas por q; e &, (a é a letra 
grega alja). 

Mencionou-se anteriormente que os desvios padrões de uma 
amostra e da população são representados, respectivamente, por s 
eo. 


Problemas Resolvidos 


Momentos 


à. Determinar: (a) o primeiro; (b) o segundo; (c) o terceiro; 
(d) o quarto momentos, para o conjunto de números 2, 3, 7, 8, 10. 
Solução: 


po BX TES ETES AO 30 
N 5 5 


(a) 


é o primeiro momento ou média aritmética. 


ZX PASSARA + 296 
NT 


fas 5 5 


é o segundo momento. 


yi a ZX ZAPAS AI 1890 oo. 
(Aeir E = = 378 

é o terceiro momento. 

Rr 4 4 ta oyi TEN á 
(a) Xi = EE o Dt + as + 10) = DA giga 


é o quarto momento. 


2. Determinar: (a) o primeiro; (b) o segundo; (c) o terceiro; 
(d) o quarto momentos centrados na média, para o conjunto de 
números do Probl. 1. 
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Solução: r 
s ——s 2(X-Ū 
@) m = (X - X) = y E 


-983-047-0480 +008) O So 
5 5 À 


m é sempre nulo porque X — E=X-X=o0. (Probl. 16, Capítulo 3.) 


-s _ A(X- 
O ma = 0-3 = SETA 


C-PHB-BAO-O (8 8 + (10 oF dO d 92. 
E 5 Bos 
Note-se que mə é à variância s. 


O m- ET ER 


«LOPO +E-OA0O-O =18 dg 


5 5 
a A (x-y $ 
(d) ma = X E = SESAL 
C-O +B- 6+0 t86 t000 610 À a 
x E i É 


8. Determinar: - (a) -o.primeiro;...(b) 0 -segundo;-(c) -0 terceirop== += -= 


(d) o quarto momentos centrados na origem 4, para o conjunto de 
números do Probl. 1. 


Solução: 


2-4 


No 


(a) m' = (X — 4) = 


-LABAT -9EB VEU A) o 


5 


=n _ I(x -4 
O my = RI E 
-CABET A + a U04 66 a 
= 5 E 2 
Z-S 


(e) mis (X = 4% = N 


P E A S a a C a M SA C + Eaa a a L a 
E 5 
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ini ao Y AYI 
(d) ma! (e a = Ear = 


LAGO a + (AS + O af 1650 
5 5 


= 330. 


4 Usando os resultados dos Probis. 2 e 3, verificar as relações 
entre os momentos: (a) ma = my — my? (b) ma = my — 3ma/my! + 
+m”; (e) ma = my — mim + öm my — 3m. 

Solução: | 

Do Probl, 3i, my = 2, mg = 13,2, my = 59,6, my” = 330. Então: 

(a) mg = my — my? = 18,2 — (2) = 182 — 4 = 9,2. 


O) m = my — 3m'my + 2m? = 59,6 — 3(2) (13,2) + 2 (2? = 59,6 — 
— 792 +16 = — 3,6. 


(e) m = më ~ m'm + 6mm — my! = 330 — aceso, 6) + 6(2} (18, 2)— 
— 8(2) = 122, em concordância com o Probl, 2. 


5. Provar que: (a) ma = mm? (b) ma =m; — 3 m'm? + 
m; (O) m = my — 4mm? + ôm m — 3m". 


Solução: 


(ay Se d= X > A, então X= Ata = A+i é x-E= dd: 


ma -XR -a dy =d-odd+d! = 
=p da dê de my = mf 


6) m = (X — F} = (d — d} = (ad + add? — d) = 
a digd d? pad] = dê gd d? 4 Qdo my — 3 mimy + 
+ Rm, 


O m = (X -X = (ddr = (di 4d d + edt d? — ada? +d) = 
T adi poaa 4s 4 d = E mad pod! di adt = 


aoma — my my + my? me — 3m”. 


Por extensão dêste método, podem ser deduzidos resultados semelhantes 
para me, Me ebe. 


Cálculo de -momentos para dados agrupados 


6. Determinar os quatro primeiros momentos, centrados na 
média, para a distribuição das alturas do Probl. 22, Capítulo 3. 
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Solução: 
Tabela 5.1 


f ju ju ju fu 

5 —10 20 —40 80 
18 -18 18 -18 18 
42 0 0 0 0 
27 27 27 27 27 

8 16 32 64 128 


= Zj = 100 | Z jJu = 15 | Èf? = 97 Eju = 33 |Zjut = 253 


GR 
my Zi (9 (E 5) = 1,20, m =o Zhi MAs 2) = 186,06 
1 100. 144, a! 100 FRA 


m = E = (8) = = 62,08, muy = az 


= (8)! o) = 10 362,88 


de modo que: 
0 


ma = mf — mi? = 62,08 — (1,2) = 60, 
mg = ma — 3m’ my +m” = 136, 96 — Sa, 262,08) + X1,2} = — 33,072 
mas = mg — Amy mal +m my — 3m = 


10362,88 — 4(1,2)(186, 96) + 6(1, OR, 08) — 3(1,2) = 9 205,5224, 

7. Determinar: (a) m; (b) my; (0) ma; (d) ma; (O) mas 
O mi (Q mi W mi OF O s EO E pam a 
distribuição do -Probl. 19, Capítulo 4. 


Tabela 5.2 PRESSA 
fu pè pè pè 

—24 144 -864 5 184 
—45 225 —1 125 5625 
-64 256 —1024 4 096 
—84 252 —756 2268 
—90 180 —360 720 
— 66 88 —66 66 
o 0 0 9 
72 72 12 72 
108 216 432 get 
it 342 1026 3078 
108 432 1728 5912 
90 450 2 250 11250 
66 396 2376 14 256 
35 245 1715 12005 
16 128 1024 8192 

N =P =480 | È ju=236 | E fu? =3 404 | E fu? =6 428 È ju =74 4 588 

bai saida 
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(0) m =e Ele o 1,9667. 


ago 

(0) mr = e ZE qu se = 113,4667. 
Bs 8 

(e) mf = au = (4 Ea = 857,0667. 


baj 5 
a) mg! = ot ELE Et = a (1 = 39 780,2667. 


(e) m = 0. 
U) m =m? = m’? = 143,4667 — (1,9667)2 = 109,5988. 


(g) me = m? — Bm m + 2m’ = 857, 0667 - as 9667)(113,4667) + 
-+ 2(1,9667)? = 202,8158. 


(h) ma = ma’ — Amy my + Gm my — 3m” = 35 627,2853. 


p nmo z 
ti) E (ATO) =4 Em ETET ve = 94 + 1,9667 = 95,97. 
G) s= Vma = V109,5988 = 10,47. 
9) X = (ATP = AAi A = APONTAR O A E Am Fm = 


= (94)? + 2(94) (1,9667) + 113,4667 =9 319,2 063, ou 9319 com quatro algárismos 


significativos. 


Q X = (A FaF = (4 F SAd F 3AF F Ë) = AS + 3AA ASAE + Rm 
= A? + 3A’mp + 34mo! + my) = 915 571,9597 ou 915600 com quatro 


algarismos significativos. 


Contrôle de Charlier 


8. Exemplificar o emprêgo do contrôle de Charlier para os 


cálculos do Probl. 7 
Solução: 


Para efetuar o contrôle pedido, somam-se as seguintes colunas às do Probl. 7, 
com exceção da coluna 2, que é aqui repetida por conveniência. 
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Tabela 3.3 
Ee 1 
Pi Fur | jati | aty 

-5 100 —500 2 500 
—& 9 —36 144 —576 2 304 
-3 16 —48 144 — 432 1 298 
—2 28 — 56 112 — 224 448 
-1 às —45 45 -45 45 

o 66 9 0 0 0 

1 85 85 85 85 85 

2 72 144 288 576 1152 

3 54 162 486 1 458 4 374 

4 38 152 608 2:432 9 728 

5 27 135 675 3 375 16 875 

6 18 108 ` 648 3 888 23 328 

7 7 539 3773 - 26 411 

8 40 320 2 560 20 480 

9 162 1 458 13 122 

N = Èj = 480 | Bfu+1) = 716 [2f + = - NOES Ne 
Ê = 4 356 = 17 828 = 122 148 


Em cada um dos grupos seguintes, 2 primeira igualdade é tirada da Tabela 5-3 
e a segundo da Tabela 5-2, do Probl. 7, A igualdade de resultados, em cada grupo, 
proporciona o contróle pedido. š 


Rs 
E ju +N = 236 + 480 = 716. 


Z ju +1)? = 4 356 
Epp 2È ju t N = 3 404 + 2236) + 480 = 4356. 


i i È jiu +17 = 17 828 


Ep H3 Efu +3E ju t N = 6428 +3(3404) + 3(236) + 480 = 17828. 


Bj taf + 6Bf tAE ju HN = 74588 + 46 428) + 63 404) + 


B flu.t 1) = 122148 
+ 4(236) +480 = 122 148. 


Corzeções de Sheppard para os momentos 


$, Aplicar as correções de Sheppard para determinar os mo- 
mentos centrados na média aos dados do: (a) Probl. 6; (b) Probl. 7. 


154 . ESTATÍSTICA 
Solução: 


$ 8 
= 60,64 — SÉ = 55,31, 


(a) ma corrigido = mz ~ I~ 2 


ar Ari 7a 1 
ma corrigido = m4 — em + pnia = 9 995,6224 — e (64) (60,64) + 


7 , Eça 
+ E (4096) = 9 995,6224 — 1 040,48 + 119,46 = & 174,6024. 
mı é ma não necessitam correção. 


2 42 
0) ma corrigido = ma — Š> = 109,5988 — $ = 108,2655, 


ma corrigido = ma — 4 em + 5 = 
Es 


3% = 
20 (4) = 34 757,9616. 


= 35 627,2853 — 4 (42 (109,5988) + 


Assimetria 


10, Determinar: (a) o primeiro e (b) o segundo coeficientes de 
assimetria de Pearson para a distribuição. dos salários dos 65 empre- 
gados da Companhia P&R (veja o Probl. 44, Capítulo 3 e 
o Probl. 18, Capítulo 4). 


Solução: 


Média = Cr87976, mediana = Cr$ 7906, moda = Cr$ 7750, desvio 
padrão = s = Cr$ 1560! 


(a) Primeiro coeficiente de assimetria == fui, modo = 
= ' Cr$ 7 976 — Cr8 7 750. 


Cr$ 1560 = 0,1448 ou 0,14. 


3 (média — mediana) = 
8 


(b) Segundo cosficiente de assimetria = 


3 (r37 976 — Cr8 7 906) 
rs 1560 


= 0,1346 ou 0,13. 


Se fòr usado o desvio padrão corrigido (veja o Probl. 21(b), Capítulo 4), 
êsses coeficientes tornam-se, respectivamente: 
média — mode Cr$ 7976 — Cr$ 7 750) 


ee corrigido ` CrS 1523 = 0,1474 ou 0,15. 


3 (média -mediana) ` 3 (Cr$ 7976 — 0187905) am 
8 corrigido a ES 1 533 =0,1370 ou 0,14, . 


6) 
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Como os coeficientes são positivos, a distribuição tem assimetria positiva, 
isto é, à direita. 

11. Determinar os coeficientes de assimetria: (a) quartílico; 
(b) percentílico, para a distribuição do Probl. 10 (veja o Probl. 44, 
Capítulo 3). 


Solução: 
Qi = Cr$ 6 825; Qz = Pen = Cr$ 7906; Q = Cr$ 9075; Pio = Di = Cr$ 5 812; 
Ps = Do = Cr 10 100. 
BRA 
Qs — Qi 


n C8 9075 — 2 (Cr$ 7 906) + Cr$ 6825 
Cr$ 9075 — Cr$ 6 825 


(a) Coeficiente quartílico de assimetria = 


= 0,0391. 


Poo — 2Pso + Pro 


(b) Coeficiente percentílico de assimetria = Pio — Pig 
— Cr$ 10100 — 2 (Cr8 7906) + Cr$5 812 > 
3 GS 10100 - Cr$ 5812 | 0,0233. 


12. Determinar o coeficiente de momento de assimetria, as, 
para: (a) a distribuição das alturas dos estudantes da Universidade’ 
XYZ (veja o Probl. 6); (b)'os C.I. dos alunos da escola primária 
{veja o Probl. 7). ` fe a Ss 


Solução: 
(a) my = s? = 60,64; my = — 33,072. 
Então, ae Us  BBOTB 38,072 L 0,0701. 


s (Ym) (v B064)? 471,7792 2 


Se forem usadas as correções de Sheppard para o agrupamento [veja o Probl. 
9(a)l, então: 


a ma — 33,072 — 83,072 
as corrigido = = nE = ap or = — 0,0805. 
(Vma corrigido)? (3/5531)? 410,9533 
om ma 20288 O 1768 ou 0,18. 


So (Vma)? (v 100,5088)" 
Se forem usadas as correções de Sheppard para o agrupamento Íveja o Probi 
9(b)), então: 
ma = ORI 
(Vme corrigido)? (v 108,2655)° 


az corrigido = = 0,1800 ou 0,18. 
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Note-se que ambas as distribuições são moderadamente desviadas: (o) para 
a esquerda (negativamente); (b) para a direita (positivamente). A distribuição 
(b) é mais desviada do que a (a), i.e., (a) é mais simétrica do que (b). o que é eviden- 


ciado por ser ọ valor numérico ou absoluto do coeficiente de assimetria de (b) 


maior do que o de (a). 
Curtose 


13. Determinar o coeficiente de momento de curtose, q4, para 
os dados do: (a) Probl. 6; (b) Probl. 7. 


Solução: 


fr a o 99956224 99956224 | 
ama Coma? (60,64)? ” 3677,2096 ` 


2,718. 


Se forem usadas as correções de Sheppard Íveja o Probl. 9a)), então: 


mg corrigido = 174,6024 _ 8 174,6024 
(ama corrigido)? (55,81) 3 059,1961 


a, corrigido = = 2,672. 


i a Pinia 35 627,2853 
O a = TE a m = oposa = 29600 ou 297. 
Se forem usadas as correções de Sheppard [veje o Probl.. 9(b)], então: 


eu cortigido = — 4 Corrigido. 34 7579016 
Sê Eco E ma corrigido)? (108,2655) 


= 2,9653 ou 2,97. 


Como para uma distribuição normal, q = 3, segue-se que ambas as distri- 
buições (a) e (b) são platicúrticas em relação à normal (i.e. menos pontiagudas do 
que ela). No que se refere à agudeza da curva, a distribuição (b) aproxima-se 
muito mais da distribuição normal do que a (a). Entretanto, no Probi. 12, & 
distribuição (a) é mais simétrica do que (b), de modo que, quanto à assimetria, 
(a) aproxima-se mais da distribuição normal do que (b). 


14. (a) Calcular o coeficiente percentílico de curtose, K = 
= QUPs — Pr), para a distribuição do Probl. 11. (b) Qual seria, 
sua aproximação em relação a uma distribuição normal? 


Solução: 

(a) Q = } (Qs — Qi) = (Cr$ 9075 — Cr3 6825) = Cr3 1125: Poo — Pio = 
= Cr$ 10 100 — Cr$ 5812 = Cr3 4288. 

Então, « = Q/Pso — Pro) = 0,262. 


(b) Como x, para a distribuição normal, tem o valor 0,263, conclui-se que a 
distribuição dada é mesocúrtica (i.e. quase tão pontiaguda como a normal). Por 
conseguinte, a curtose da distribuição é quase igual à da normal, o que .nos conduz 
a acreditar que ela é bem próxims desta, pelo menos no que diz respeito à curtose. 
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Problemas Suplementares 


` Momentos 


15. Determinar o: (a) primeiro; (b)-segundo; (c) terceiro; (d) quarto mo- 
montos, do conjunto de números 4, 7, 5, 9, 8, 3, 6. 

Resp: (a) 6; (@) 40; (c) 288; (d) 2 188. 

16. Determinar o: (a) primeiro; (b) segundo; (c) terceiro; (d) quarto mo- 
mentos centrados na média, para o conjunto de números do Probl. 15. 

Resp: (0) 0, (b) 4 (c) 0; (d) 25,86. 


17. Determinar o: (a) primeiro; (b) segundo; (c) terceiro; (d) quarto 
momentos centrados no número 7, para o conjunto de números do Probl. 15, 


Resp: (0) —1; b) 5; (0) — 91; (d) 53. 

18. Usando os resultados dos Probls. 16 e 17, verificar as relações entre 
os momentos: (a) ma = my — ma? (b) ma = ma — 3m my + 2m’; (c) ma = 
= ma — Amy mi + 6m? mi — 3m. 

19. Determinar os quatro primeiros momentos centrados. na média de um 
conjunto de números em progressão aritmética: 2, 5, 8, 11, 14, 17, 

Resp: O; 26,25; 0; 1 193,1. E 


20. Provar que: (a) my = ma + hh, (b) my = ma + 3hma + Bite) m = 
= my + 4hms + 6hêmo + hº, em que h = my. 


21. Seo primeiro momento centrado no número 2 éigual a 5, qual é a média ? 
Bog De mma amas minis va Br gos PAN RDI 


22. Se vs 4 primeiros momentos centrados ne origem 3 de um conjunto de 
números são iguais a —2, 10, —25 e 50, determiner os momentos correspondentes: 
(a) centrados na média; (b) centrados na origem 5; (c) centrados na origem zero. 

Resp.: (a) 0, 6, 19, 42; (b) — 4, 22, — 117, 580; (c) l, 7, 38, 74. 

23. Determinar os quatro primeiros momentos centrados ne média, dós 
números: 0, 0, 0, 1, 1, 1,1, 1. 

Resp.: O 0,2344, = 0,0586, 0,0696. ; 

24. (a) Provar que ms = my — Smy'ma” + 10m my — 10m? mg + amb. 
(5) Deduzir uma fórmula semelhante pare me. 

25. De um total de N números, a fração p é composta de números 1, enquanto 
que a fração q=1I—-po é de zeros. Determinar: (a) my (b) ma (0) ma; 
(d) ms, pare êsse conjunto de números. Comparar com o Probl, 28. 

Resp: (0) m=0; 0) m=py () polar) (0) pot? pa tg) 

26. Prövar que os 4 primeiros momentos centrados na média da progressão 
aritmética aq, a +d, e +2d, cg a + — ijd são: 


= Ly Es elmo 2a pd. 
m = 9, m= gg DE, m = 0, m= or 13n De. 
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Comparar com o Probl. 19. Veja também o Probl. 69, Capítulo. 4. 36. Determinar os cocficientes de assimetria: (a) quartílico; (b) percen- 
tílico, para a distribuição do Probl. 59, Capítulo 3. Comparar os resultados com 
os do Probl. 35 e justificá-los. 

Resp: (a) — 0,02; (b) — 0,13. 


[Sugestão:: 


MAS + (a = 1) = dam 1) 2n — 1) (é — 
= 3r = 1) ` 
Momentos pare dados agrupados 37. (a) Explicar por que os coeficientes de assimetria de Pearson não são i 
adequados à distribuição do Probl. 31, Capítulo 2. (b) Determinar o coeficiente ! 
quartílico de assimetria para essa distribuição e interpretar o resultado. 

Resp.: (b) — 0,078. 


27. Caleulár ọsi4 primeiros momentos centrados na 
média para a distribuição da Tabela 5.4. 

Resp: m = 0 mg = 5,773, m= — 0,5920, m = 
= 87,3125. 5 


28. Exemplificar o emprêgo do contrôle de Charlier 
| para os cálculos do Probl. 27. 
do Probl. 27: (a) sem as correções de Sheppard; (b) com elas. 


29, Aplicar as correções de Sheppard aos momentos Resp.: (a) 2,62; (db) 2,58. l | 


obtidos no Probl. 27. . 
Resp: ma(corrigido) = O, ma(corrigido) = 5,440, 
h ma(corrigido) = — 0,5920, mu(cortigido) = 76,2332. Total 30 


39. Determinar o coeficiente de momento de curtosé para a distribuição 
do Probl. 59, Capítulo 3: (a) sem; (b) com as correções de Sheppard (veja O 
Probl. 30). 


30. leula 4 - 
0. Calcular os 4 primeiros momentos centrados na média para à distri Resp: (a) 2,94; (b) 2,94. 


buição do Probl. 59, Capítulo 3: (4) sem as correções de Sheppard; (b) com as 


correções de Sheppard. 40. Os quatro momentos centrados na média das duas distribuições do 
{ Resp: (a) mi =0 m = 0,53743, ma = 0,36206, m4 = 0,84914; (b) ma (cor- q Probl. 34 são 230 é 780, respectivamente. Qual é a distribuição que mais se 
rigido) = 0,51660, m4 (corrigido) = 0,78378. E aproxima da normal, do ponto de vista: (a) da agudeza; (b) da assimetria? 


Resp.: (a) segunda; (b) primeira. | 


Curtose 
É 38.. Determinar o coeficiente de momento de curtose, as, para a distribuição 
| 


81. Determinar: (a) my (b) mz; (e) ma; (d) m; (0) X Os; (9) E; re 


(h) x; (i) XE G) (X + 1}, para a distribuição do Probl. 62, Capítulo 3. SE 41. Quais dss distribuições do Probl. 40 é: (a) leptocúrtica; (b) mesocártica; 

Resp: (a) 0; (b) 52,95; (e) 92,35; (d) 715820; (e) 26,2; U) 7,28; (9) Ei (c) platicúrtica, i 
739,58; (h) 22247; (1) 706428; (j) 24545. E Resp.: (a) segunda; (b) nenhuma; (c) primeira. ` pai 
Assimetria Ps E 42. O desvio padrão de uma distribuição simétrica é 5, Qual deveria ser 


o valor do quarto momento centrado na média, para que a distribuição fôsse: (a) 
teptocúrtica; (b) mesocúrtica; (c) platicúrtica ? 


Resp.: (a) maior que 1875; (b) igual a 1875; (c) menor do que 1875. 


32. Determinar o coeficiente de momento de assimetria, ag, para a distri- 
` buição do Probl. 27: (a) sem; (b) com as correções de Sheppard. 
Resp.: (0) ~ 0,2464; (b) — 0,2464. 

43. (a) Calcular o coeficiente percentílico de curtose K, para a: distribuição 
do Probl. 59, Capítulo 3. (b) Comparar o resultado com o valor teórico, 
0,263, da distribuição normal e interpretá-lo. (c) Como se poderá conciliar êsse 
resultado com o Probl. 39. 

Resp.:. (a) 0,813. 


33. Determinarco coeficiente de momento de assimetria, «3, para 2 distribuição 
do Probt..59, Capítulo 3 (veja o Probl. 30): 


Resp.: 0,4939. 


34. Os segundos momentos centrados na média de duas distribuições são 

9 e 16, enquanto que os terceiros momentos, referidos à mesma origem, são — 8,1 

e — 12,8, respectivamente. Qual é a distri ibuição mais desviada pera a esquerda ? 
Resp: A primeira distribuição: 


35. Determinar: (a) o primeiro e (b) o segundo coeficientes de assimetria 
de Pearson, para à distribuição do Probl. 59, Capítulo 3. Justificar as diferenças. 


Resp.: (a) 0,040; (b) 0,074. 


CaríruLo 6 


TEORIA ELEMENTAR DA PROBABILIDADE 
DEFINIÇÃO CLÁSSICA DE PROBABILIDADE 


Suponha-se que um evento E possa acontecer de h maneiras 
diferentes, em um total de n modos possíveis, igualmente prováveis. 
Então, .a probabilidade de ocorrência do evento (denominado sucesso) 


` é definida por: 


p = PriE) +. 


A probabilidade de não-ocorrência do evento (denominado insu- 
cesso) é definida por: 
h. h 


q = Prinão E) = "5 =1- >=] p=1- Pr{E}. 


Assim, p + q = 1 ou Pr{ £} + Pr{não E) = 1. 
O evento “não E” é representado, às vêzes, por É, E ou ~ E. 


Exemplo: Admita-se que o evento E seja a ocorrência dos números 3 ou 
4, em um único lance de uim dado. Há .seis maneiras segundo as quais o dado 
pode cair, e que resultam nos números 1, 2,3, 4, 5 ou 6, Se o dado é honesto 
(isto é, não é viciado), pode-se supor que as seis maneiras sejam igualmente pro~ 
váveis, Como E pode ocorrer de duas destas maneiras, tem-se: ` i 


A probabilidade de não ser conseguido um 3 ou um 4 (isto é, de ocorrer 
um 1, 2, 5 ou 6) é: 
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Note-se que a probabilidade de um evento é um número come 
preendido entre 0 e 1. Se o evento não pode ocorrer, sua pro- 
babilidade é O. Se êle deve ocorrer, isto é, se sua ocorrência é 
certa, sua probabilidade é 1. 


Se p é a probabilidade de que um evento ocorra, a vantagem 
a favor de seu acontecimento é de p : q (leia “p para q"); a vanta- 
gem contra seu acontecimento é de q : p. Por conseguinte, a vanta- 


gem contra o aparecimento de um 3.ou um 4, em um único lance 


de um dado honesto, é de q:p = -i $ = 2 : 1, isto é, 2 para 1. 


Definição da probabilidade como fregiiência relativa 


A definição anterior de probabilidade apresenta a desvantagem 
da expressão “igualmente provável” ser vaga. De fato, como essa 
expressão parece ser sinônima de “igualmente possível”, a definição 
é circular, porque se está definindo essencialmente a probabilidade 
com seus próprios térmos. Por essa razão, tem sido advogada por 
alguns autores uma definição estatística de probabilidade. De acôr- 
do com isso, a probabilidade avaliada ou probabilidade empírica de um 
evento é considerada como a frequência relativo de sua: ocorrência, 
quando -o-número--de- observações é muito grande. - A .probabilidade 
prôpriamente dita é o limite da fregiência relativa, quando o número 
de observações cresce indefinidamente. 


Exemplo: Se em 1 000 lances de uma moeda resultam, 520 caras, à 
fregiiência relativa das caras é de 529/1 000 = 0,529. Se em outros I 000 lances 
resultam 493 caras, a frequência relativa no total dos 2 000 lances é de (520 + 
+ 4932 000 = 0,511. De acôrdo com a definição estatística, prosseguindo-se 
dessa maneira, poder-se-á finalmente chegar cade vez mais próximo de um nú- 
mero que será denominado probabilidade de ocorrer uma cars no único lance 
de uma moeda. De acôrdo com os resultados até agora apresentados, ela será 
de 0,5, com um algarismo significativo. Para obter outros algarismos significa- 
tivos, deveriam ser feitas outras observações adicionais. 


- A definição estatística, embora útil na prática, apresento, difi- 
culdades do ponto de vista matemático, visto que um número limite 
real pode verdadeiramente não existir. Por essa razão, tem sido 
desenvolvida axiomaticamente uma teoria moderna, na qual a pro- 
babilidade é um conceito indefinido, como o ponto e a linha são in- 
definidos em geometria. 


162 ESTATÍSTICA 


Probabilidade condicional. Eventos independentes e depen- 
dentes ` 


Se Ei E, são dois eventos, a probabilidade de E» ocorrer, de- 
pois de F, ter acontecido, é definida por PrfEdE,| ou PrfE» 
dado Ei) e é denominada probabilidade condicional de Es, depois de 
E, ter ocorrido. 


Se a ocorrência ou não de E, não afetar a probabilidade da ocor- 
rência de Fs então Prik5|E;) = Pr{E:} e diz-se que E, e E, 
são eventos independentes; no caso contrário, êles são eventos depen- 
dentes. ` 


Se se representar por Æ, Æ: a ocorrência de “ambos os eventos 
E, e Er’, às vêzes denominada evento composto, então: 


Pr{E E) = PriBi) PriBol Bi). j (1) 
Em particular: 
Pri E, Ei) = Pri£,) Pr{E:}, para eventos independentes. (2) 
Para três eventos, Ei, E: e Es, tem-se: 
Pr(Zs Es Es] = Pr(By) Pri Eol E) PriB;[B,E:), (3) 


« isto é, a probabilidade de ocorrência de E, E: e E; é igual à pro- 
habilidade de Ei, vêzes a de Æ, depois de E, ter ocorrido, vêzes a 
de E, depois de ambos os eventos E, e E, terem ocorrido. Em par- 
ticular: 


Pr{Ei E: B} = Pr{ E) Pr{ E} PriBo), (4) 
para eventos independentes. 


Em geral, se Bi, Ea Es, ..., En são n eventos independentes 
que têm, respectivamente, as probabilidades” 


Pu Po Pa -< Pa então a probabilidade da ocorrência simultá- 
nea de E, Bo; Es, o En Ê Pi Pa Pa Pa 


Exemplo 1. Sejam E, e Fz os eventos “cara na quinta jogada” e “cara 
na sexta jogada” de uma moeda, respectivamente. Então, Ee Ez são eventos 
independentes, de modo que a probabilidade de ocorrer cara em ambas as jo- 
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gadas, quinta e sexta, é, admitindo-se que a moeda é “honesta”: 


Pri EE) = Pri E} Pria) -G)x6)- = 


Exemplo 2. Se a probabilidade de que A esteja vivo daqui a 20 anos é 
07 e a de que Bo esteja daqui a 20 anos é 0,5, então a probabilidade de que 
ambos estejam vivos daqui a 20 anos é de (0,7)(0,5) = 0,35. 


` Exemplo 3. Suponha-se que uma urna contém 3 bolas brancas e 2 bolas 
pretas. Seja E, o evento “a primeira bola retirada 6 preta” e E, o evento 
“a segunda bola retirada é preta”, não; sendo as bolas recolocadas depois de re- 
tiradas. Aqui, Zı e Ep são eventos dependentes. ` 


Pr{E,) = 2/2+3 = 2/5 é a probabilidade da primeira bola retirada ser 


` preta, enquanto que PriBolBi] = 1/3+1 = 1/46 a probabilidade da segunda 


bola retirada ser preta, depois de retirada a primeira dessa côr. Então, & proba- 
bilidade de amibas as bolas retiradas serem pretas é: 


aje - 


1 
PrfBi Bo) = PrtBiJPrB E) = Sm o 


Eventos mútuamente exclusivos 


Dois ou mais eventos são ditos mùtuamente exclusivos se a ocor 
rência de um déles exclui.a dos outros. Então, se E, e E; são even- 
tos mutuamente exclusivos, Pr{ Æ: Fa} = 0: 

Se E, + E; representa a ocorrência de “E, ou de E, ou de am- 
bos”, então: 


Pr{ E, + Ea} = PrF} + Pr{ 8} — Prf E Bo). (5) 
Em particular: 


PriB; + Es) = PrlBy) + PriBo) (6) 
para eventos mútuamente exclusivos. s 


Como extensão dêsse conceito, se Pi, Ea... ., E, São n eventos 
mutuamente exclusivos, que têm as probabilidades de ocorrência 
Po Pa ---; Pa, respectivamente, a probabihdage de ocorrência de 
E, ou Ez ou ... En € pi + pa E oo F Pw 


Exemplo 1. Se E; é o evento “extração de um ás de um baralho” e E 
o ds “extração de um rei”, então Pr{[¥1} = 4/52 = 1/13 e Prig) = 4/52 = 1/13. 
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Então, a probabilidade de se extrair ou um 4s, ou um rei, em um lance único é: 
o] E l 1 2 
Priky + Ea) = Prò Ea) + Peli == += = 
rtkr } {Ea + Prf} tBTI 
visto que ambos, ás e rei, não podem ser extraídos ao mesmo tempo e por isso 
são eventos anútuamente exclusivos. 


Exemplo 2. Se E; é o evento “extração de um ás de um baralho” e E» 
é o da “extração de uma carta de espada”, então E, ¢ Ea não são mutuamente 
exclusivos, visto que pode ser extraído o és de espadas. Assim, a probabilidade 
da extração de um és ou de uma carta de espadas, ou de ambos, é: 


Pri + Bal = Prf Ba) + Pela) = Pr (Bo) = E = 
16 +, 
52 13 


Distribuição de probabilidade discreta 


Se uma variável X pode assumir um conjunto discreto de va-, 


_ lores Xi Xa o., Xg, com as probabilidades p1, Pe ..., Pk, respecti- 


vamente, sendo pi + pa + > + pg = 1, diz-se que está definida 
uma distribuição de probabilidade discreta de X. A função p (X) que 
assume os valores py, Po ..., Px, respectivamente, para X = X, 


Xer... Xx, € denominada junção de probabilidade ou de fregiência 
de X. Como X pode assumir certos valores com dadas probabi- 
lidades, êle é frequentemente denominado variável aleatória discreta. 
A variável aleatória é também conhecida como variável casual ou 
estocástica. 


Exemplo: Suponha-se o lançamento de um par de dados honestos e que 
X indique a soma dos pontos obtidos. Então, a distribuição de probabilidade 
é dada pela seguinte tabela: 


x 2 3 4 5 6 78 9 10 11/12 


p(X) 1/36 27: 6 4/36 5/36 60/36 5/36 4/36 3/36 2/36 1/36 


Por exemplo, è probabilidade de obter-se a soma 5 é de 4/36 = 1/9. Então, 
pode-se esperar que em 900 lances dos dados, 100 lances dêem a soma 5. 


Note-se que isso é análogo a uma distribuição de fregiiências 
relativas, com estas substituídas pelas probabilidades. Por essa 
razão, podem-se imaginar as distribuições de probabilidade como 
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uma forma teórica ou de limite ideal das distribuições de frequên- 
cias felativas, quando o número de observações feitas tornar-se muito 
grande. Por esta razão, pode-se imaginar que as distribuições de 
probabilidade referem-se a populações, ao passo que as distribuições 
de freqüências relativas referem-se a amostras delas extraídas. 


A distribuição de probabilidade pode ser representada gràfica- 
mente, mediante a locação de p(X) em relação a X, da mesma, for- 
ma que a distribuição de frequência relativa (veja o Probl. 13). 


Mediante a acumulação das probabilidades, obtêm-se distribui- 
ções de probabilidades acumuladas, análogas às de fregiiência relativa 
acumulada. 


A função associada a essa distribuição é, às vêzes, denominada 
Junção de distribuição. 


Distribuições de probabilidade contínua 


As idéias acima podem ser estendidas ao caso, em que a va- 
riável X pode assumir um conjunto contínuo de valores. O poli- 
gono de fregiiência relativa de 
“uma amostra torna-se, no caso 
teórico ou limite de uma popu- 
lação, uma. curva contínua, como 
a apresentada na Pig. 0-1, cuja 
equação é Y = p(X). A área 
total limitada por essa curva e 
pelo eixo dos X é igual a tea 
área compréendida entre as ver- Fig. 6d 
ticais X=a e X=b (som 
breada na figura) dá a probabilidade de X cair entre 0 e b, a qual 
pode ser representada por Prfa < X <b}. 


ph iea ai pee me 


p(X) é denominada junção de densidade de probabilidade ou, 
abreviadamente, função de densidade, e quando é dada uma função 
dessa natureza, diz-se que foi definida uma distribuição. de probabi- 
lidade contínua para X. A variável X 6 então denominada, fres: 
quentemente, variável aleatória continua. 


Como no caso discreto, podem ser definidas distribuições ds 
probabilidade acumulada e funções de distribuição associada 


| 
i 


l 
| 
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Esperança matemática 


Se p é a probabilidade de uma pessoa receber uma quantia S, 
a esperança “matemática, ou simplesmente esperança, é definida por 
ps. e 


Exemplo:. Se a probabilidade de um homem ganhar um prêmio de US$ 10 
é de 1/5, sua esperança é de 1/5 (US$ 10) = US$2. . 


O conceito de esperança é fácilmente estendido. Se X repre- 
senta uma variável aleatória discreta que pode assumir .os valores 
Xy Xa ..., Xx, com as probabilidades de Pı, Pr, .. -p Px, respectiva- 
mente, sendo pı + Pa + + pg = 1,a esperança matemática de X, 
ou simplesmente sua esperança, representada por E(X), é definida por: 


K 
EGO = Pi + pX + + prk = x BX; = pX. (7) 
£ 


Se as probabilidades p; forem substituídas, nessa expressão, 
pelas frequências relativas 1;/N, em que N = È j;, a esperança redu- 
sir-se-á a (E JX)/N, que é a média aritmética X de uma amostra 
de tamanho W, na qual Xs, Xz ..., Xg aparecem com essas freqüên- 
cias relativas. Quando W tornar-se cada vez maior, a freqüència 
relativa J/N aproximar-se-á, da probabilidade pj Por isso, é-se 
conduzido a interpretar E(X) como a representação da média da 
população da: qual a amostra foi extraída. Se fôr representada por 
m a média da amostra, a da população poderá ser indicada pela letra 
grega correspondente, u (mu). 

A esperança pode também ser definida para variáveis aleató- 
rias contínuas, mas essa definição requer o uso do cálculo infinite- 
simal. 


Relação entre média e variância da amostra e da população 


Se fôr selecionada, ao acaso, uma amostra de tamanho N de 
uma população (isto é, admitindo-se que tôdas as amostras são igual- 


mente prováveis), é possível, então, mostrar que o valor m esperado. 


para a imédia"da amostra é igual à média p da população. 

Não se pode concluir, entretanto, que o valor esperado para 
qualquer quantidade calculada, da amostra seja igual à correspon- 
dente da população. Por exemplo, o valor esperado para a variân- 
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cia de uma amostra, como foi definida, não é igual à da população 
e sim (N — DN vêzos esta variância. Esta é a razão pela qual 
alguns estatísticos preferem definir a variância da amostra como 
sendo'a que foi definida, multiplicada por NAN — 1). 


Análise combinatória 


Para a obtenção da probabilidade de eventos complexos, a enu- 
meração de casos é frequentemente difícil, tediosa, ou ambas as coi- 
sas. Para facilitar o trabalho necessário, apela-se para, os conceitos 
básicos estudados na disciplina denominada análise combinatória. 


Princípios fundamentais 


Se um evento pode acontecer de qualquer um de nı modos e 
se, quando êle ocorrer, um outro evento pode realizar-se de qualquer 
um de n modos, então o número de maneiras segundo as quais am- 
bos os eventos podem ocorrer numa determinada ordem será Mi Ng. 


Exemplo: Se há 3 candidatos a governador e 5 æ prefeito, os dois cargos 
podem ser preenchidos de 3 X 5 = 15 modos. 


Fatorial de n 
O fatorial de 2, representado por n!, é definido, por: 
nt=n(n- D(n—- Bl ; (8) 
Então, 5L=85 X4X3 X2 X1 = 120; 413! = (4 X3 X2x 


X1) X(8 X2 X1) = 144. £ 


Convém definir 0! = 1. 


Permutações 


Uma permutação de n objetos diferentes, tomados r de cada vez, 
é um arranjo de r dos n objetos, levando-se em consideração a ordem 
de sua disposição. 
O número de permutações de n objetos, tomados r de cada vez, 
é representado por: nP,, P(n, r) ou Par e é dado por: 
n! 


{n = D! = 


Prena aA rts 


! 
i 
| 


| 
H 
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Em particular, o número de permutações de n objetos, tomados 
nan, é 


aani imn) dl =al 


Exemplo: O número de permutações das letras a, b e c, tomadas duas de 
cada vez, 6 sy = 3:2 = 6. São! ab, ba, ac, ca, be, cb. 


O número de permutações de n objetos distribuídos em grupos, 
dos quais m são iguais, n: são iguais, ... é: 


onde n =n, +n: + TA (10) 


Exemplo: O número de permutações das letras da palavra estatisticas 6: 


121 


3131221111] 7 3 926 400, 


vistó que há 3s, 34. 2a, 2%, lc, Je. 
Cornbinações 


Uma combinação de n objetos diferentes, tomados r de cada 
vez, é uma êscolha de r dos n objetos, não 'se levando em consideração 
a ordem de sua disposição. O número de combinações de n objetos, 
tomados r de cada vez, é representado por „Cn Cin, 1); Car ou G) 
e é dado por: 


on Dei rtD n! aPr. 


E me Set 
ici ri rin — r)! rl 


a) 


Exemplo: O número de combinações das letras a, b e ç, tomadas duas de 
cada vez, é: 


São: ab, ac, be. Note-se que ab é » mesma combinação que ba, mas não 
é a mesma permutação. 


20-19-18 
1 


Tem-se pOr = alum Então, Cir = 65 = = 1140. 


O número de combinações de n objetos tomados, 1 ou 2, ou 
n de cada vez, éi OG tale += 2 — 1 


_ vo finito de pontos, então, a -ca- 


. do probabilidade, de modo que a 
- soma de todos os números corres- 
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Aproximação de Stirling para n! 

Quando n é grande, a avaliação direta de n.! é impraticável. 
Nesses casos, usa-se uma fórmula aproximada, devida a Stirling, 
que é: 


nt- V2manter, : (12) 


em que e = 2,71828 ... é a base dos logaritmos. naturais (veja o 
Probl. 31). i 


Aplicação da teoria dos conjuntos à probabilidade 


Na teoria moderna da probabilidade, imagina-se que todos os 
êxitos ou resultados possíveis de uma experiência, de um jôgo etc., 
são representados por pontos de um espaço (que pode ser de uma, 
duas, três ou mais dimensões), i 
denominado espaço. umostral Š. 
Se S contiver sômente um núme- 


da ponto, pode ser associado um 
número não-negativo, denomina- 


pondentes a todos os pontos de $ 
seja igual a 1. Um evento é` 
um conjunto ou coleção de pon- 
tos de S, como os designados E; ou E; na Fig. 6-2, denominada 
diagrama de Euler ou de Venn, $ 


Fig. 6-2 


O evento E; + E» é o conjunto de pontos que estão tanto em Es, 
como em E, ou em ambos, enquanto que E, E, é o conjunto de 
pontos comuns a E, e Es. Então, a probabilidade de um evento, 
tal como Es, é a soma de tôdas as probabilidades associadas a todos 
os pontos contidos no conjunto Bj. Semelhantemente, a probabili- 
dade de E, + Ea, representada por Pr{¥, + E), é À soma das 
probabilidades associadas a todos os pontos contidos no conjunto i 
E+ E: Se E, e E: não têm pontos comuns, isto é, se os eventos 
são mutuamente exclusivos, então Pr (E; + Er} = Pr {E1} + Pr [E]. 
Se êles têm pontos comuns, então: 


Pr Ei + bo) = Pr{ E} + Prita) — Prf E Ei). 
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o conjunto E, + Es, representado freqientemente por Z, U Es, 


é denominada” união dos dois conjuntos. O conjunto EEr, repre- 


sentado frequentemente por Ei NE», é denominado interseção dos 
dois conjuntos.” Podem-se estender essas definições a mais de dois 
conjuntos. Assim, em vez de E, + E, + E; e de E, E, Es, podem 
ser usadas as nótações E; U E, U Es e Ei N E, N Es, respectiva: 
mente. 

Usa-se, às vêzes, um símbolo especial & para. representar um 
conjunto sem nenhum ponto, denominado conjunto vazio. A proba- 
bilidade associada a um evento correspondente a êsse conjunto é 
nula, isto é, Prig) = 0. Se E; e E, não possuem pontos comuns, 
pode-se escrever E, E, = 4, o que significa que òs eventos corres- 
pondentes são miútuamente exclusivos e que Pr(B,E,) = 0. 

De acôrdo com essa representação moderna, uma variável alea- 
tória é uma função definida, em cada ponto do espaço amostral. 
Por exemplo: no Probl. 37, a variável aleatória é œ soma- das coorde- 
nadas de cada ponto. 


No caso em que $ tem número infinito de pontos, as idéias acima, 


podem ser estendidas, por meio de conceitos que envolvem o cálculo 
infinitesimal. 


Problemas Resolvidos 


Regras fundamentais de probabilidade 


1. Determinar a probabilidade p, ou sua avaliação, para cada 
um dos seguintes eventos: 

(a) De aparecer um número ímpar em um único lance de um 
dado honesto, 


De 6 casos igualmente possíveis, 3 (quando o dado apresentar 1, 3 ou. 5) - 


são favoráveis ao evento. Então, p = 3/6 = 1/2. 
(b) De ocorrer pelo menos uma cara em dois lances de uma 
moeda honesta. $ 


Se R representa“ “cara” e T “coros”, os dois lances podem conduzir-nos & 
quatro casos: HH, HT, TH, TT, todos igualmente prováveis. Apenas os três 
primeiros casos são favoráveis 20 evento. Então, p = 3/4. 

(e) De surgir um ás, um dez de ouros ou um dois de espa- 
das na retirada de uma carta única de um baralho, bem embara- 
lhado, de 52, cartas. 


car 6: TEORIA ELEMENTAR DA PROBABILIDADE ITL 


` O evento pode ocorrer de 6 modos (ás de espadas, ás de copas, ás de paus, 
ás de ouro, dez de ouro e dois de espada), em 52 casos igualmente poss En- 
tão, p = 6/52 = 3/26. 


(d) De aparecer o total 7 em um único lançamento de dois 
dados. 


Cada uma das 6 faces de um dado pode ser associada às 6 do outro, de mo~ 
do que o número total de casos que podem surgir, todos igualmente prováveis, 
é: 6X6=36. Eles podem ser representados por (11), (2/1) (31), ..., (6:60). 


Há 6 modos de obter-se o total 7, representados por: (10), (25), (3;4), (4,3) 
(5:2), (651) [veja o Probl. 37(0)). Então, p = 6/86 = 1/6. 


(e) De aparecer uma coroa, no próximo lance de uma moeda, 
se, de um total de 100 lances, 56 foram caras, 


Como foram obtidas (100—586) = 44 coroas em 100 lances, a probabilidade 
avaliada ou empírica de ocorrer uma coroa é igual à frequência relativa 44/100 = 
= 0,44. 


2. Uma experiência consiste em lançar uma moeda e um dado. 
Se E, é o evento correspondente ao aparecimento de uma “cara” 
no lançamento da moeda è E, o de ocorrer “3” ou “6” no lance, do 
dado, expor, em palavras, o significado de cada uma das seguintes 


notações: $ 


(o) F f Coroa na moeda e nada no dado. 

w É, 1,2,4 ou 5 no dado e nada na moeda. 

(o) ED, Cara na moeda e 3 ou 6 no dado. 

£ 

(d)  Pr{ EE} Probabilidade de cara na moeda e de 
1, 2, 4 ou 5 no dado. 

(e) Prí Zl Es) Probabilidade de cara na moeda, depois 
de ter aparecido um 3 ou um 6 no 
dado. 


(O PrE, + E) Probabilidade de coroa na moeda ou de 


1,2, 4 ou 5 no dado, ou de ambos. 


ESTATÍSTICA: 


3. Uma bola é retirada ao acaso de uma urna que contém 6 
vermelhas, 4 brancas e 5 azuis. Determinar a probabilidade dela: 
(a) ser vermelha; (b) ser branca; (c) ser azul; (d) não ser verme- 
lba; (e) ser vermelha ou branca. 


Solução: 


Admite-se que V, Be A representam os eventos da retirada de uma bola 
vermelha, de uma branca e de uma azul, respectivamente. Então: 


(0) Pety} = modos de escolher uma bola vermelha 6 no 

total de modos de escolher uma bola 6 +4+5 
a k 

15. 5º 

W Pr PEE A E 

(PAD qro” 6 

RE SIR ES 

OPA = FIFI 3 


Outro método: 


Pr{V + Bl= PrlÃl=1—PrA) = 1 — 1/3 = 2/3, pelo item (c). 


Note-se que Pri Y + RB} = Pr {Y} + Pr {B}, isto 6, 2/3 = 2/5 + afis. Esse 
é um exemplo da regra geral PriBi + Ez] = Prii} + PrlE4), que é ver- 
dadeira para os eventos mituamente exclusivos E, e Ep. 


4. Um dado honesto é lançado duas vêzes. Determinar a pro- 
habilidade de ocorrer um 4,5 ou 6 no primeiro lance e um 1, 2, 3 ou 
4 no segundo lance. 


Solução: 


E, = o evento correspondent 
ir "1, 2,3 ou 4" 


ya 4 Seu 6", ne pri 


Cada uma des 6 mar dado pode cair no primeiro 


undo jar nem total d 
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Cada uma das três maneiras, segundo as quais Z pode ocorrer, pode ser 
associada a cada uma das quatro de E», o que dá 3 X 4 = 12 modos, segundo 
os quais ocorre tanto E e E», como Fi Ez 3 


Então, Pr{ EE} = 12/36 = 1/3. 


Note-se que a expressão Pr{E:E:}) = Prf En - Pr{ E}, isto é, 1/3 = 3/6 X 4/6, 


É é válida para os eventos independentes E é Ep 


5. Duas cartas são retiradas de um baralho, bem embaralhado, 
de 52 cartas. Determinar a probabilidade de ambas serem ases, se à 
primeira carta fôr: (a) recolocada; (b) não recolocada. 


Solução: 


Seja Ej =o evento correspondente & sair um 4s na primeira retirada e Es 
o de ocorrer um às na segunda. 


(a) Se a primeira carta fôr recolocada, Ey e E, serão eventos indepen- 
dentes. Então: $ 


Pr{ambas as cartes retiradas serem ases} = Pr{ EE) = PrE) Pr{ Ea) = 
= (4/52) (4/52) = 1/369. ; 


(b) A primeira carta pode ser retirada de qualquer ume de 52 maneiras 
e a segunda de qualquer um de 51 modos, se a primeira carta não fôr recolo- 
cada. Então, ambas as cartas podem ser retiradas de 52 X 51 maneiras, tô» 


“das igualmente possíveis” EESE n 


Há 4 modos segundo os quais E, pode ocorrer e três para que Xz aconteça; 
assim, tanto: Xi e Ez, como Ei E», podem ocorrer de 4 X 3 modos, Então, 
AX3. cg ns 
52X 5) 22" 

Note-se que Pr{ E!E} = Prída segunda carte ser um ás “depois de ocor- 
rer outro na primeira} = 3/51. Nessas condições, O resultado 6 um exemplo da 
regra geral Pr(BiB;) = Pr(Ey] Pr(X>|Ei) quando Ei e Ka são eventos inde- 
pendentes. 


Pr |E, E) = 


6. Três bolas são retiradas, sucessivamente, da ursa do Probl. 8. 
Determinar a probabilidade delas serom retiradas na ordem ver- 
melha, branca e azul, quando cada bola fôr: .(a) recolocada; 


- (b) não recolocada. 


Solução: 


Seis V =v evonto de ums bola “vermelha” na primeira extração; B = 
= ocorrência de uma “branca” na segunda e 4 = o aparecimento de uma, “arul” 
na terceira. Pede-se PriVBA). 


aati 


Ná - ESTATÍSTICA 


(a) Se cada bola é recolocada, V, Be 4 são eventos independentes e: 


: Pr{VBA} = Pr{ V} PriB] Pr{A} = 


(G a EE + 3) (z + à + 3) = (i 15) X 5 sja ” n 


(b) Se cada bola não é recolocada, V, Be A são eventos dependentes e: 


©. © PrV B A} = Pr{Y} Prigi V} Pra Bv) = g 
= (ETET), Grin) CE, z ($) (a) (5) g i 


em que Pr(4|BV] é a probabilidade condicional de ser obtida uma bola azul, de- 
pois de uma branca e uma vermelha terem sido extraídas. 


7. Determinar a probabilidade de aparecer um 4, pelo menos 
uma vez, em dois lances de um dado honesto. 


Solução: 


Seja E, = evento “4” no primeiro lance e By = evento “4! no se- 
gundo, 


E, +E = evento “4” no primeiro lance ou “4” no segundo, ou- 


ambos, 


= evento de, pelo menos, um “4” em um dos lances. Desé- 
jase PrfBy + Bo). 


1.º método: 


Número total de modos igualmente possíveis, segundo os quais ambos: os 
dados podem cair = 6-6 = 36. 


Também: número de modos da ocorrência de E, mas não de E = 5, nú- 
mero de modos da ocorrência de Es, mas não de E, = 5, número de modos 
de ocorrerem E; e Eg, simultâneamente = 1, 


Então, o número de modos segundo os quais pelo menos um dos oventos 
E; ou Es pode ocorrer = 5 +5 +1 =11,e PriZy+ Eg = 11/36. 


2.º método: 


Como Æ, e Æ não são mituamente exclusivos, Pr(B, + E) = PrfEj] + 
+ PriBal — Pr{ 8, Bol. 


Também, como E; e E» são independentes, Pr{E;E,} = Pr (E) Pr(Eo). 
Então: 
Pri Er + E) = Priby) + PriPo) — Pri Ei PriBo) = 


Ea nas EE 
“e te” (5) O- 
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3,º método: 


-Pr {ocorrência de pelo menos um 4) + Prinão ocorrer um 4) =1. 


Então, Prlocorrência de pelo menos um 4) = 1— Prínão ocorrer um 4) = 
= 1 — Prfnão ocorrer um 4 no Lº lance e nem no 2º] = 1 — Pri 
— PriF} Pr{E} = 1 — (5/0)(5/6) = 11/36. 


8. Uma bôlsa contém 4 bolas brancas e 2 pretas; outra contém 
3 brancas e 5 pretas. Se fôr retirada uma bola de cada bôisa, de- 
terminar a probabilidade de: (a) ambas serem brancas; (b) ambas 
serem pretas; (c) uma ser branca e a outra preta. 


Solução: 


Sejam B, = ocorrência de uma bola “branca” na primeira bôlsa, 
B, = ocorrência de uma bola “branca” na segunda bôlsa. 


Pr(By) PrfBol = (qi) (sis) =+ 
5 


Pe Bh Pra = (alles =p 


(c) A probabilidade de “uma ser branca, e a outra preta” é a mesma de` 
“a primeira ser branca e a segunda preta” ou “a primeira ser preta e a segun- 
da branca”, isto é, BiB: + BBa. Como os eventos BiB; e BB se excluem 
mùtuamente, tem-se: ” 


(a) PriBiBo) 


(6) Pri BiB 


Pri BiB: + BiBol = Pri BBa) + Pr( BiB} = 
Kri 


= PriBy) Pri Ba) + Pr( Bi) PriBal = (G) + 
Gil) 


Outro método: 


A probabilidade desejada é: 
$ 


1 — Pri BBa — Pri BiB) =1—->—&s ES 


9. Ae B jogam 12 partidas de xadrez, das quais 6 são. venci- 
das por A, 4 por B e 2 terminam empatadas. Eles combinam a 
disputa de um torneio constante de 3 partidas. Determinar a pro- 
babilidade de: (a) A vencer as três partidas; (b) duas partidas ter- 
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minarem empatadas; (c) 4 e B vencerem alternadamente; (d) B 
vencer pelo menos uma partida. 


Solução: 


Representemos por Au 42 e Á; os eventos correspondentes & “A vencer" 
os 1.º, 2º e 3.º jogos, respectivamente. 

Representemos por Bı, Br e B; os eventos correspondentes a “B vencer” 
as 1º, 25 e 3º partidas, respectivamente. 

Representemos por Tp Tze Ta os eventos correspondentes a “empate” 
nas 1.º, 2% e 3.º partidas, respectivamente. 

Com base na experiência, anterior (probabilidade empírica), poder-se-á ad- 
mitir que: i 


PrfA vencer qualquer uma partida} = £ a 4 , 


PriB vencer qualquer ums partida) = To = E 


Prfqualquer partida terminar empatada} = Dut: 
(a) Pr{A vencer tôdas as 3 partidas} = Pr 4; Az 43) = 
é L i 1 k - 

= Pridi) Prl) Prida) = (+) G) G) x 4, admitindo-se que 
o resultado de cada partida é independente de qualquer outro, o que parece 
justificável (a mënos que vs jogadores, naturalmente; se influënciem psicològica- 
mente por'suas wtras vitórias ou derrotas). 

(b) Pr{2 partidas terminarem empatadas} = 

= PriLe e 2a ou le 3a ou 2º e 3 partidas terminarem empatadas) = 

= Prò ToTa} + Pr(TiTaTo) + Pr(TiToTa = 

= PriTil Prf To} PrlTal + PrtTil Pri Ta) PrfTal + Prif) Peito) Prits} = 


-OOO DO -s-s 


(c) PriÃe B vencerem alternadamente} = Pr{ocorrerem as vitórias na or- 
dem A, B, A ou na B, A, B} = 


= Pr(41BpÃo + Bi49Bs) = Pri AyBo44) + Pr[ BAB} = 
= Pr(Ai} Pri Ba} PrlAs! + Pri Bi} Pri Aa? PriBgl = 


00O- 
2) 3 z 37 N2 ) ( 7) Edit; 
(d) Pr{B vencer pelo menos uma partida) = 1 — Pr[B não vencer nenhuma 


partida} = 
=) — Pr( BBB} = 1 — Prò Bi} Pri Bo) Prò B) = 


-OO Bm 


[j 
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Distribuição de probabilidade 


10. Determinar a probabilidade de haver meninos e meninas 
em famílias com 3 crianças, admitindo-se as mesmas probabilidades 


para ambos. 


Solução: 

Seja B = o evento correspondente a haver “menino” na família e G = o de 
haver “menina”. - Então, de acôrdo com & hipótese de probabilidades iguais, 
PriB} = PriG) = 1/2. Em famílias de 3 crianças podem ocorrer Os seguin- 
tes eventos mituamemte exclusivos, com as correspondentes probabilidades in- 


dicadas: 


(a) 3 mmohinds (BBB). Então, Pr(BBB) = Pr(B) Pr(B) Pri B} = 1/8. 


Neste caso, admite-se que o nascimento de um menino não é “influenciado, 
de modo algum, pelo fato de ter sido também menino uma criança nascida an- 
teriormente, isto é, admite-se que os eventos são independentes. 


(b) 3 meninas (GGG). Então, como no item (a), ou por simetria 
PriGGG] = 1/8. 
(e) 2 meninos e 1 menina (BBG + BGB + GBB). Então: 


Pri BBG + BGB + GBB}. = PriBBG) + Pr{ BOB} + Pr{GBB} = 
e = .Pr(BI PrlB) Pr(G) + PrlB] Prig) Pray 


“+ Pr(G) Pr(B) PriB] = 
l 3 


É qd q 
atg teng 


(à) 2 meninas e 1 menino (GOB + GBG + BGG). Como no item (c), ou 
por simetria, & probabilidade é de 3/8. pS 


Representando-se por X & Ra 


variável aleatório que representa Número de meninos X 0123 
o número de meninos em uma fa- a 
míli com 3 crianças, & distri- Probabilidade p(X) 18 38 38 1/8 


buição de probabilidade está in- 
dicada na tabela ao lado. 


11. Representar graficamente à distribuição do Probl. 10. 


Solução: 


E O gráfico pode ser representado como na Fig. 6-3 ou ne Fig. 6-4. 


Note-se que a soma das áreas dos retângulos da Fig. 6-4 é igual è 1. Nessa 
considéra-se X como variáve: 


| igura, denominada histograma de probabilidade, 
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continua, se bem que ela seja realmente discreta, processo que muitas vêzes 
se revela conveniente. A Fig. 6-3, por outro lado, é- usada quando não 
se deseja considerag, variável como contínua. j 


p : pix) 


EO 


3 


2 
Nómoro do mosinos Número do meninos 


Fig. 6-3 Fig. 6-4 


12, Uma variável aleatória contínua X, que tem valores come 
preendidos apenas entre O e 4, tem uma função de densidade dada 
por p(X) = 1/2 — aX, em que à é uma constante. (a) Calcular a. 
(b) Determinar Prfl < X < 12). 


Solução: 


(a, O gráfico de p(X) = 1/2 — aX é uma linha reta, como está indicado 


“na Fig. 6-5: Para determinar a, deve-se compreender que 2 área total entre 


a reta e o eixo dos X, entre X =0c X = 4, deve ser igual a 1. 
Para X = 0, p(X) = 1/2; para X = 4, p(X) = 1/2 — 4a. Deve-se, então, es- 
colher a de modo que a área trapezoidal seja igual a 1, 
Área trapezoidal = 1/2 (altura) (soma das bases) = 1/2 (4) (1/2 + 1/2 — 
— 4a) = 2 (1 — 4a) = 1, donde(l — 4a) = 1/2; 4a = 1/2 e a = 1/8. Em con- 
seqüência, 1/2 — 4a é, realmente, à 
p) p(X 


É + 


in ; ue 
~ 
va 4 | n 


Fig. 6-5 Fig. 6-6 


pr 
“4 


igual a zero, de modo que æ representação gráfica correta é a apresentada na 
Fig. 66. e 
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(b) A probabilidade pedida” é igual è área compreendida entre X=le 
X = 2, indicado por meio de sombreado na Fig. 9-6. 


De acôrdo com o item (a), p(X) = 42 — 1/8 X. Então, pl) = 3/8 e p(2) = 
= 1/8 são as ordenadas para X=le X = 2, respectivamente. 
A área trapezoidal pedida é: 


70 (G+5) cio 


que é a probabilidade desejada. 


Esperança matemática 


1%. Se um homem adquirir um bilhete de loteria, poderá ga- 
nhar um primeiro prêmio de US$ 5000 ou um segundo de US$2000, 
com as probabilidades de 0,001 e de 0,003. Qual será o preço justo 
a pagar pelo bilhete? : 


Solução: 

Esperança = (US$ 5 000) (0,001) + (USS 2 000) (0,003) = US$ 5 + uss 6 = 
= US$ 11, que é o preço justo a pagar. . 

14. Em uma certa especulação comercial, um homem pode ter 
um lucro de US$ 300, com a probabilidade de 0,6, ou um prejuízo 
de US$ 100, com a probabilidade de 0,4. Determinar sua esperança.” 


Solução: 
Esperança = (US$ 300)(0,6)-+(— US$ 100) (0,4) = US$ 180 — US$ 40 = US$ 140. 


15. Determinar: (a) E(X); (6) EK; (© ERX — 3), para a 
seguinte distribuição de probabilidade. 


X 8 12 18 20 24 


p(X) us 8 38 1j. a2 


Solução: 
(a) EGO = EXX) = (8) (1/8) + (12) (1/16) + (16) (3/8) + (20) (1/4) + 


+ (24) (1/12) = 16. 
Teso representa 2 média ds distribuição. 


O EG?) = EXPO = (BIB) + (12P (110) + (1678/8) + QOPGA) + 


+ (4P (1/12) = 276. 
` Tszo representa o segundo momento centrado na oxigem zero. 
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©). BUX — F = XX — EX) = (8 — 16}0/8) + (12 — 16} (1/6) + 
-+ (16 — 16)?(3/8) + (20 — 16 (1/4) + (24 — Jo? (1/12) = 20. 


Isso representa a variância da distribuição.” 


16. Uma bôlsa contém 2 bolas brancas e 3 pretas. Quatro 
pessoas, 4, B, C e D, são chamadas, nessa ordem, para retirar uma 
bola, não a restituindo à bôlsa. A primeira a retirar uma bola branca 
receberá US$ 10. Determinar suas esperanças. 


Solução: 


Como há sômente 3 bolas pretas, uma pessoa pode vencer em sus primeira 
tentativa. Sejam 4, B, C e D os eventos correspondentes a “A vencer”, "B 
vencer”, "C vencer” e “D vencer”, respectivamente. 


A 3 2 
Pr{A vencer) = PrlA) = i 


= É (US$ 10) = US$4. 


2 
=. Então, a esperança de 4 é = 


PrlA perder e B vencer] = Pr[ ÄB) PrlÃ! Pr(BIA) = (5) (2) HE 


Então, a esperança do B é = US$ 3. 


Pr{A e B perderem e C vencer) = Pr(ÃBC) = Pr(A) PriBIA) 


3 2 
Pr(CIA B) = (5) (5) (: z) = + Então, a esperança de C é= a US$2. 


Prl4, Be C perdereme D vencer) = Prt4 BO D) = Pr{A} PriBIA) 


aeremiraorancs = (HGGH 


de é D = US81. 


Li 


$ - Então, a esperança 


"Verificação: US$4 + US$3 + US$2 + US$] = US$ 10 e | 


Permutações 


17. De quantas maneiras podem ser dispostos em fila 5 peda 
ços de mármore de côres diferentes? 
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Solução: A 
Os 5 pedaços de mármore podem ser dispostos nas 5 posições “seguintes: 


A primeira posição pode str ocupada por qualquer um dos 5 pedaços de 
mármore, isto é, há 5 modos de preencher a primeira posição. Quando isso 


_ tiver sido feito, haverá 4 modos de preencher a segunda posição. Então, há 


3 modos de preencher a terceira posição, 2 de preencher a quarta e, finalmente, 


_ existe apenas um de preencher a última posição. Portanto: 


. Número de arranjo dos 5 pedaços em fila = 5 X4X3 X2X 1 =5 = 120. 
Em geral: 
Número de arranjos de n objetos diferentes em fila = n(n — 1) (n — 2): 
l= 


Pode-se também denominá-lo número de permutações de n objetos diferen- 
tes tomados ao mesmo tempo e representá-lo por nPm 


18. De quantas maneiras 10 pessoas poderão sentar-se em um 
banco, se houver apenas 4 lugares? 


Solução: 


O primeiro lugar pode ser preenchido de 10 manciras e, quando isso. tiver 
sido feito, haverá 9 maneiras de preencher o 2º lugar, 8 de preencher o terceito 
e 7 de preencher o quarto.. Portanto: 

Número de arranjos de 10 pessoas, tomados £a 4 = 10 X 9 X 8 X 7 = 5040. 

Em geral: 

Núniero-de “arranjos demobjetos diferentes; tomados ra r=n{n —1) (t 2). 

“(n—r+). 

É também denominado número de permutações de n objetos diferentes, to- 
mados r de cada vez, e represêntado por nr, P(n,?) ou Par. Note-se que, 
quando r = n, nPp = n!, como no Probl. 17. 


19. Calcular: (a) Pa; (b) Pu (0) uP (d) Pa 

Solução: 

(a) Ps = 8:7-6 = 336; (b) Pa = 6-5-4-3 = 360; (c) 15Pr= 15; (d)aP = 
= 3-21 = 6. 

20. Deseja-se colocar 5 homens e 4 mulheres em fila, de modo 
que as mulheres ocupem os lugares pares. Quantos arranjos são 
possíveis ? 

Solução: 


Os homens podem ser colocados de Ps modos è as mulheres -de P4. Cada 
arranjo dos homens pode ser associado a cada um dos arranjos das mulheres. 

Então, o número desejado de arranjos é = sPs X 4Pa = 5141 = (120) (24) =. 
= 2 880. 
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2L Qu itos números de 4 algarismos: podem ser formados 
com os 10 garismos, 0, 1, 2, 3,...,9 se (a) forem permitidas 
as repetições; - (b) elas não forem permitidas; (c) à último algarismo 


_ deve ser zero e não forem permitidas as repetições? 


Solução: , 

(a) O primeiro algarismo pode ser qualquer um dos 9 (visto que o zero não 
é permitido). O. segundo; terceiro e quarto algarismos podem ser qualquer um 
dos 10. Então, 9 X 10 X 10 X 10 =-9 000 números, podem ser formados. 

(0) O primeiro algarismo pode ser qualquer um dos 9 algarismos (qualquer 
um, menos o zero). P 

O segundo algarismo pode ser qualquer um dos 9 (qualquer um, mas não 
o usado para o primeiro). 

O terceiro algarismo pode ser qualquer um dos 8 (qualquer. um, menos 03 
usados para os dois primeiros). $ 

(e quarto algarismo pode ser qualquer um dos 7 (qualquer um, menos os usa- 
dos. para os três primeiros). : 

Então, 9X9 X8X7 = 4 536 números podera ser formados. 


Outro método: 


o primeiro algarismo pode ser qualquer um dos nove e os três remanescen- 
tes podem ser escolhidos de oP} modos. Então, 9-9P; =9:9:8:7=4536 
números podem ser formados. 


tc) O primeiro algarismo pode ser escolhido de 9 modos, o segundo de 8 
e o terceiro de 7. Então, 9.8: 7 = 504 números podem ser formados. 


Outro método: 


O primeiro algarismo pode ser escolhido de 9 modos e os dois seguintes de 
sP modos. Então; $- sP» = 504 números podem ser formados. 


32. Quatro livros diferentes de matemática, seis de física e dois 
de química devem ser arrumados em uma prateleira. Quantos 
arranjos diferentes são possíveis se: (a) os livros de cada matéria 
devem ficar todos juntos; (b) apenasvos de matemática devem ficar 
juntos? 


Solução: 


(a) Os livros de matemático podem ser arrumados entre si de 4P, = 4! mo- 
dos; os de lisica de «Ps = 6! modos; os de química de P2 = 21 modos, e os três 
grupos de 3Ps ="3! modos. 


Então, o número pedido de arranjos = 4! 61213! = 207 360. 


tb) Consideram-se os quatro livros de majemática como sendo um único. . 


Então, há 8 livros que podem ser arraniados de P4 = 9i modos. Em tôdas estas 


+ E 
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maneiras, os livros de matemática estão juntos. Mas, 'êsses livros podem ser 
arranjados entre si de 4P4 = 4! modos. 


Então, o número pedido de arranjos = 914! = 8 709 120. 


23. Cinco mármores vermelhos, dois brancos e três azuis es- 
tão arrumados em linha. Se todos os mármores da, mesma côr não 
são distinguíveis um dos outros, quantas arrumações diferentes são 
possíveis? 


Solução: 

Admita-se que há P arranjos diferentes. Multiplicando-se P pelo número 
de modos de arranjar entre si: (a) os cinco mármores vermelhos; (b) os dois 
brancos; (c) os três azuis (isto é, rmultiplicando-se P por 51213, obtém-se © 
número de modos de arranjar os 10 mármores, se eles fôssem distinguíveis, isto é, 
101. 

Então, (S!218)P = 10! e P = 101612131). 

Em geral, o número de arranjos diferentes de n objetos, dos quais ny Nye 


... ny SãO iguais entre si, é: sendo m + net o Enk =n 


“Rial compl 

24, De quantos modos diferentes 7 pessoas poderão sentar-se 
em tôrno de uma mesa redonda se; (a) elas puderem sentar-se em 
qualquer lugar; (b) duas determinadas pessoas não puderem sen- 
tar-se ao lado uma da outra? i 


Solução: 

(a) Esteja uma delas sentada em qualquer lugar. Então, as 6 restantes 
podem sentar-se de 6! = 720 modos, que é o número total de modos das 7 pes- 
soas serem arranjadas em círculos. 

(b) Considerem-se as 2 pessoas determinadas como uma única, Então, bhé 
6 pessoas juntas, que podem ser dispostas de 5! modos. Mas, as 2 pessoas con- 
sideradas como uma podem ser arranjadas entre si de 2! modos. Em consequen- 
cia, o númiero de modos de arranjar 6 pessoas em, tôrno de uma mesa redonda, 
com as duas pessoas indicadas sentadas juntas, é = 512! = 240. ; 


Então, em vista do item (a), o número total de modos, segundo os quais 6 


pessoas podem sentar-se em tórno de uma mesa redonda, de modo que duas de~ 
terminadas pessoas não fiquem juntas, é = 720 — 240 = 480 modos. 


Combinações 


25. De quantas maneiras 10 objetos podera ser separados em 
dois grupos que contenham 4 e 8, respectivamente ? 
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Solução: 


Isso é iguai ao número de permutações de 10 objetos, dos quais 4 e 6 são 


iguais.entre si, De acôrdo com o Probi, 28, Te” ser = 210.- 


Ésse problema é equivalente à determinação do número das seleções de 4 
dos 10 objetos (ou de 6 dos 10), considerando-se a ordem como indiferente. 

Em geral, o número das seleções de robjetos de um total de n, denominado 
número de combinações de n coisas, tomadas r de cada vez, é representado por 
nOr, Cr, 7) ou (e Je é dado por: 


are BL a MD nort aP, 
den 7 =" 


26. Calcular: (a) Ca; (b) Cs; (o) Cu 


Solução : 


st = E A SI-L T 
a Ta aos 


o! 6:5-4:3-2 . 
0) GG = aa = 6, ou sd = ¿Ci = 6. 
to) “4C4 é o número das seleções de 4 objetos, tomados de ums, só vez, e há 
 sômente uma seleção. Então, 404 = 1, 


Note-se que, formalmente, sC = or = 1, definindo-se 0! = 


27, De quantas maneiras uma comissão de 5 ő pessoas pode 
ser escolhida entre 9? 


9X8xY7 
Eidos XXS 198, 


Solução: 9C% = 
5 


28. Entre 5 matemáticos e 7 físicos, deve-se formar uma, co~ 
missão constituida de 2 matemáticos'e 3 físicos. De quantas ma- 
neiras isso pode ser feito se: (a) qualquer matemático e qualquer 
físico podem ser incluídos; (b) um determinado físico deve ser in- 
eluído; (c) dois determinados matemáticos não devem ser incluí- 


` dos? 


Solução 


(a) 2 matemáticos entre 5 podem ser selecionados de sC> modos. 3 físicos 
entre 7 podem ser selecionados de C3 modos. Número total de seleções posst- 
veis = 50, X 403 = 10 X 35 = 350. 
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(b) 2 matemáticos entro 5 podem ser selecionados de Cz modos. Os 2 físi- 
cos remanescentes, entre os 6, podeí ser selecionados de C2 modos, 


Número total do seleções possíveis = 50» X 602 = 10 X 15 = 150, 


6) 2 matemáticos entre 3 podem ser selecionados de sC modos. - 3 fisi- 
cos entre 7 podem ser selecionados de 103 modos. Número total de seleções possi- 
veis = 3Co X 104 = 3 X 35 = 105. 


29. Um rapaz tem 5 moedas, cada uma de valor diferente. 
Quantas somas diferentes podem ser formadas? 


Solução: 


Cada moeda pode ser tratada de 2 maneiras, isto é, pode ser escolhida ou 
não. Como cada um dos 2 modos de tratar uma moeda associa-se aos 2 de tratar 


“cada uma das outras, o número de modos de escolher as 5 moedas = 2º, Mas, 


os 2º modos incluem o caso de não ter sido tomada nenhuma moeda, 


Em “consequência, o número desejado de somas = P-l=3 


Outro método: 
Pode-se selecionar, entre as 5 moedas, 1, 2...,0u5. Então, o número dese- 
jado de somas é: , 
sCã + C2 + sC3 + 504 + 505 = 5 +10 +10 + 5 + 1 = 3 
Em geral, pare qualquer inteiro positivo n, nC + nC? +C t E E 
EE eae 


30. Com 7 consoantes e 5 vogais, na pda podem 
ser formadas, que sejam compostas de 4 consoantes e 3 vogais, tô- 
das diferentes? Não é necessário que as palavras tenham signi- 
ficado. 


Solução: 


As 4 consoantes diferentes podem ser escolhidas de (4 modos, as 3 vogti 
de sC; modos o as 7 letras resultantes (+ consoantes e 3 vogais) podem se; 
modos. Então: 


jadas entre side ;Py 
Número de palavras = Cy slar Ti=35X10X5 040 = 1 764 000, 
Aproximação de Stirling para n! 


81. Calcular 50! 


Sohação: 
do n, nim NV Ban nte, 


09 6 = S. 


Para grandes valo: 
Então, 50! ~ 1/3 
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Para o cálculo de S, empregam-so os logaritmos de base 10. Então: 


log (v 1007 50% g5 og 160 + logar + 50 log 50 — 50 log e = 
+ $ log 100 + $ log 3,142 + 50 log 50 ~ 50 iog 2,718 = 
~- = $ (2) + $ (0,4072) + 50 (1,0990) — 50 (0,4343) = 64,4836. 


Logo, S = 3,04 X 10%, número de 65 algarismos. 
Probabilidade e análise combinatória 


32. Uma urna contém 8 bolas vermelhas, 3 brancas e 9 azuis. 


Se 3 bolas são retiradas ao acaso, determinar a probabilidade de: 


(a) tôdas serem vermelhas; (b) tôdas serem brancas; (c) 2 serem 
vermelhas e 1 branca; (d) pelo menos 1 ser branca; (e) ser retirada 
1 de cada côr; (f) serem retiradas na ordem vermelha, Branca e azul, 
Solução: 
(a) Primeiro método: 


Sejam Vu Voe V4 os eventos correspondentes & ser retixada 1 bols verme- 
lha “na 1º extração”, “na 28? e “ng 80”, respectivamente, Então, Ni VaVs 
represente o evento correspondente à extração de 3 bolas vermelhas. 


Pr(VaVaVol = Prò Va) PrfValV PriVal Vi Vo) = (8/20X7/19X6/18) = 
= 14/285. 


; Segundo método: 


Probabilidade pedida = 
número de escolhas de 3 entre 8 bolas vermelhas sC Já 


número de escolhas de 3 entre 20 bolas wC 285" 
(5) Usândo o segundo método. indicado no item, (a): 
É Cs 2 
P TA TEAR psp 
ritôdas 3 serem brancas) Os * TIO 


O primeiro método indicado no item (g) também pode ser usado. 


(e) Pri2 serem vermelhas e 1 branca) = 


= (escolha, de 2 bolas entre 8 vermelhas) (escolha de 1 bola entre 2 brancas) a 
número de escolhas de 3 entre 20 bolas 


BP XI L 


ls 95 


(d) Prinenhuma ser branca) = 
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l a BC str str 38, 
te) Priser extrafis 1 de cada côr} = ER = s 


(f) Pribolas serem extraídos na ordem vermelha, branca e szul] = 


1 ; -+6 -se o resul 
= L Priser extraída de cada còr} s Lg) 7 05 usando-se o resultado 


do item (e). 


Outro método: 
Pri Val PriBol Va) PrlAs|Vo Bal = 
S (5) (5) (55) as 
“A 2g 19 18 95" 
33. Cinco cartas são tiradas de um baralho de 52 cartas, bem 
embaralhado. Determinar a probabilidade de: (a) 4 serem ases; 
(b) 4 serem ases e l rei; (c) 3 serem dez e 2 valetes; (d) serem” ti- 


radas 9, 10, valete, dama e. rei, em qualquer ordem; (e) 3 serem 
do mesmo naipe e 2 de outro; . (f) ao menos uma ser ás. 


Pri Yi Ba dal 


4 


Solução: 


a Leali a 
(a) Prid secs) ls SETAS 


04404 y mml 
s205 649 740 


(0) Prl4asese 1 rei} = 


POE O OES S 
(c) Pr(3 dez e 2 valetes) = mas 108250 * 


(D) Pr{9, 10, valete, dama, rei, em qualquer ordem} =, 


n Ciar Ca aCi: aCi (BA 
j 5205 162 435 
q P 4 03 Bal! 429 
(e) Pri3 do mesmo naipe, 2 de outro! apito e =i! 


porque hg 4 modos de escolher o primeiro naipe e 3 de escolher o segundo. 


Cs 85,678 ' 
s206 54145 ` 


t) Prinenhum ás) = Prfao menos um ds) = 


35673 _ 18472 
54145 54145 


Z4. Determinar a probabilidade de ocorrerem três 6 em 5 lances 
de um dado honesto. 
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Solução: 
Representem-se os lances do dado pelos cinco traços: — — mm — 


A cada traço corresponderá um dos eventos 6 o não 6 (5). Por exemplo; 
podem surgir três Ge dois não 6 sob às formas 66666 ou 66086 eto. 


Pasto: isso, a probabilidade de um evento como 6 6 66 5 é: 


Pri6 6 86 6) = Pri6) Pr{6} Pr {5} Pr(6] Pr(6] = 
Li 5 LISO (AY IS. 
-ixr tx G) (5) 


3/5 
Semelhantemente, Pr(65606) = (5) (5) etc., para todos os even- 


A 


tos em que ocorrem três 6 e dois não 6. Mas, há 50; = 10 eventos dessa natu- 
roza que sc excluem mituamente. Então, a probabilidade desejada é& ` 


$ 125 


en -a GY (8) 
Prt66066 ou 606UG ou cte.) = sC E 5 388 


Em geral, se p= PriE) c q = Pr(B), então, mediante o mesmo raciocínio 
acima, ia probabilidade de obter exatamente NÆ em N tentativas é de 
A pY e F, 


35. Verifica-se, em uma fábrica, que, em média, 20% dos pa- 


. vafusos preduzidos por uma determinada máquina não satisfazem 


à certas especificações. Se forem selecionados ao acaso 10 para- 
iusos da produção diária dessa máquina, determinar a probabilidade 
de serem defeituosos: (a), exatamente 2; (b) 2 ou mais; (c) mais 


d 


Solução: 


(a) Yri2 parafusos defeituosos) = 10C% (0,2)? (0,88 = 45 (0,04) (0,1678) = 


= 0,0302, mediante raciocinio idêntico ao empregado no Probl. 34. É 
(W) Pri2 ou mais parafusos defeituosos! = 1 — Prfnenhum d OSO} — 
— Prò} defeituoso} = 1 — s0Co(0,2)? (0,8 — 19010,2) (0,8) = 1-~- (0,89) — 


~ 10(0,2) (0,8)? = 1 — 0,1074 — 0,2684 = 0,6) 

(œ) Prímais de 5 defeituosos) = Prie def} + Priz dol? + Pris dof} + 
+ Prf9 def} + Pr {10 der) = wC (0,29 (0,8)! + 10C% (0,27 (0,8P + wC 0,2} 
(0,8) + 10C% (0,2)? (0,8) + 10C10 (0,2) = 0,00637. 


36. Se 1000 amostras, cada uma de 10 parafus forem to- 
madas no problema anterior, em quantas delas esperar-sc-ia encon- 
trar como defeituosos: (a) exatamente 2; (b) 2 ou mais; (e) mais 
de 5? 
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Solução: { 

(1 000) (0,0302) = 30, de acôrdo com o Probl. 35(0). 
(1 000) (0,6242) = 624, de acôrdo com o Probl. 35(b). 
(1 000) (0,00637) = 6, de acôrdo com o Probl. 35(e). 


(a)- Número esperado = 
(b) Número esperado = 
(ce) - Número esperado = 


Espaço amostral e diagrama de Euler 


37. (a) Construir um espaço amostral para um único lance de 
um par de dados honestos. (b) determinar, por meio dêsse espaço, 
a probabilidade da soma dos pontos, em um lance do par de dados, 
ser 7 ou il. i 


(6,6), 


a (89 (64 


(6.3 (6,3) 


(9,2) 


Solução: 

(u) O espaço amostral consiste no conjunto de pontos, indicado na Fig. 6-7. 
A primeira coordenada de cada ponto é o número obtido em um dado e a segun- 
da é o ouiro dado. , 

Há 36 pontos ao todo e, a cada ponto, atribuise uma probabilidade de 1/36. 
A soma das probabilidades de todos os pontos do espaço é 1. 


{b). Os conjuntos de pontos que correspondem 203 eventos “some 7? e “som 


“ma 11” estão indicados por 4 e B, respectivamente. 
Pr{A} = soma das probabilidades associadas a cada ponto, em 4 = 
Pr(B! = soma das probabilidades associadas a cada ponto, em B = 2/36. 

atos em-4 ou em B, ou em 


6/36. 


Prt4 + B} = soma das probabilidades dos pon 


ambos.= (6 + 2)/36 = 8/36=2/9. 3 
Note-se que, neste caso, Pr{4 + B} = Prid} + Pr{B}. Isso porque À e 


B não têm pontos em comum, isto é, são eventos que se excluem. miútuamente. 
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38. Ao empregar um espaço amostral que: 
EO) PHA + B) = Pr(4) + Pr{B} — Pr AB}. 


O) Pr[A $ B+C] = Pr {A} + Pr {B} + Pr {0} — Pr(AB]- 
— Pr(BC] — Pr[ 40} + Pr (ABC). 


Solução: 


o aa e B dois conjuntos de pontos que têm pontos comuns, repre- 
sentados por , Como ns. Fig. 6-8. A compõe-se de AB e AB, : i 
B compõe-se de BÃ o AB. T E 
A totalidade dos pontos de 4 + B (A, R, ou ambos) = totalidade dos pontos 
de 4 + totalidade dos pontos de B — totalidade dos pontos de AB. 
A Como a probabilidade de um evento ou conjunto é igual à soma das proba- 
bilidades associadas aos pontos do conjunto, tem-se: i 


Prid + B) = Prid} + Pr(B) — Pri AB}, 
Outro raétodo: 


Seja 4 — AB a designação do conjunto dos pontos de A, mas não dè B (is- 
to é, o mesmo que AB); então, 4 — AB e B se excluem mituamente (isto é, não 
têm pontos comuns). Também, Prlá — AB] = Pr(A) — Pr{ AB}. ' 

Por conseguinte: 


Pri +B) = Prf — AB) + Pr(B) = Pr [A] — PrÍAB) + PriB) =. 
= Pr(A) + Pr(B) — Pr (AB). 


Fig, 6-8 


(b) Sejam 4, B'e C três conjuntos de pontos, como os indicados na Fig. 6-9. 
O símbolo ABC representa o conjunto de pontos de 4 e de B, mas não os de C, 
e os outros símbolos têm significados semelhantes. j 


: Podem-se “considerar pontos, que estejam em 4, em:B, ou em C, como 
incluídos nos'7 conjuntos mútuamente exclusivos da Fig. 6-9, acima, 4 dos quais 
estão sombreados. e 3 não. A probabilidade desejada é dada por: 


PrIA4B+C) = PIA BO) + Pri 0E + PHCAB) +P(A BO + - 
int PISCA + Pri AB} +PrIABCI. 
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Isso pôsto, para obter A B E, por exemplo, retiram-se os pontos comuns & 
AeBesAeC, mas, assim procedendo, são retirados duas vêzes os pontos co- 
muns s Á, Be C. 


Por isso: 
ABG = A — AB — AC + ABC e PriABO) = Prfa4) — Pr(4B) — 
— Pr{40} + Pri ABC}. 

Encontram-se, andlogamente: 
Pr(BOA) = Pr{B} — PríBC] — PriBA) + PriBCA!] 
PriCAB) = PriC] — PriCA} — Pr(CB) + Pr(CAB] 
Pr(BCA) = PrfBC) — Pr[ABC!] 
PrICAB) = PrfCA) — PriBCA) 
PrIABO) = Pr(AB) — Prí(CAB] 
PriABC) = Pr(ABC]. 

Somando essas 7 equações, e considerando que PriAB) = PriBA( ete., 

obtém-se: 


PA +B +C} = Pr(A4] + Pr(B) + PriC] — Pri4B) — PrfBC) -- 
— PriACI + PA BO). 


39. O levantamento de 500 essiuntos que frequentavam um 
ou mais cursos de Álgebra, Física c E wutística, durante um semes- 
tre, revelou os seguintes números de estudantes de cada matéria 
indicada: 


Álgebra 329 Álgebra e Física 83 
Física 186 Algebra e Estatística 217 
Estatística- 295 Física e Estatística 63 


Quantos estudantes estão frequentando: (a) tôdas as 3 maté- 
rias; (b) Álgebra, mas não Estatística; (c) Física, mas não Álgebra; 
(d) Estatística, mas não Física; (e) Algebra ou Estatística, mas não 
Física; (f) Álgebra, mas não Física ou Estatística ? 


Solução: 


Seja 4 a designação do conjunto de todos os estudantes que estudam Álge- 
bra e (4) o número de estudantes pertencentes a êsse conjunto. Semelhante- 
mente, seja (B) o número dos que estudam Física e (C) o dos que estudam 
Estatística. Então, (A + B +C) representa o número de estudantes que fre- 
qüentam as aulas de Álgebra, de física ou de Estatística, ou suas corabinações, 
(4B) o número dos que estudam tanto Álgebra como física ete. 


Como no problems anterior, conclui-se que: 


(4 +B + €) = (4) +8) + (0 — (4B) — (BO) — (40) + (4BO). 
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(a) Substituindo os números dados nesse expressão, determina-se: 


500 = 329 + 188 + 295 = 83: 63 — 217 + (ABC): - ` 


ou (ABC) = 53, que é o número de estudantes que estudam Álgebra, Física e 
Estatística, Note-se que a probabilidade (empírica) de um estudante frequentar 
tôdas as 3 matérias é 53/500. 


(b) Para obter a informação pedida, é conveniente construir um diagrame 
de Euler que mostre o número de estudantes que pertencem & cada conjunto. 

Partindo do fato de 53 estudantes frequenterem tôdas as 3 matérias, deduz-se 
que o número dos que estudam tanto Álgebra como Estatística, mas não Física, 
E 217 — 53 = 164, o que está indicado na Pig. 6-10. Em vista das informações 
fornecidas, podem ser obtidos os outros números indicados. 


Algebra ; Fisica 


Estatística 


Fig. 6-10 


im vista dos dados, o número dos que estudam Álgebra, mas não Estatís- 
329 — 217 ou, segundo a Fig. 6-10, 82 + 30 = 112. 


(e) Número dos que freqüentam Física, mas não Algebra = $3 +10 = 103. 


(d) Número dos que freguentam Estatistica, mas não Física = 68 + 164'= 
= 282. i 


(e) Número dos que freqgüentam Álgebra ou Estatística, mas não Física = 
= 82 + 164 +68 = 314. 


Q) Número dos que freqüentam Álgebra, mas não Física ou Estatística = 82. 
Problemas Suplementares 
Regras fundamentais de probabilidade 


; 40. Determinar a probabilidade p, ou sua estimativa, de cada um dos se- 
guintes eventos: 


ta) Aparecer um rei, ás, valete de copas ou dama de ouros 20 tirar uma 
carta única de um baralho comum, bem emberalhado, 
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(b) Resultar a soma 8 em um lance único de 2 dados honestos. 


so não defeituoso se, entre 600 anteriormente 


(0) Encontrar-se um parafi 


examinados, 12 cram defeituosos. 


td) Obter 7 ou 11 em uma única jogada de um par de dados honestos. 
te) Ocorrer ao menos uma cara cm 3 lances de uma moeda honesta. 


Resp: (a) 5/26; (b) 5/36; (o) 0,98; (d) 219; (e) 7/8. 


41. Uma experiência consiste em retirar, sucessivamente, 3 cartas de um 
baralho comum bem embaralhado. Sejam E, a ocorrência. de um “rei” pa pri» 
meira retirada, E a de um “vei” na segunda e Esa de um “rei” na terceira. Ex- 
ponha, em palavras, O significado de cade um dos seguintes símbolos: 


to Pr Ea; (O) Prif El; (9) Bi + Fa (0) P(B Ph 
(o EE Es Q) PrE Be t E. Bal. 

Resp: (a) Probabilidade de um rei na primeira rotirada e não ocorrer um 
rei na segunda. a 


(b) Probabilidade de um rei na primeira retirada ou na ‘segunda, 


(e) Não ocorrer um rei na primeira ou na segunda retirada, ou em ambas 
(nenhum rei na primeira e na segunda retiradas). 


(4) Probabilidade de ocorrer um rei ne terceira retirada, depois de ter sur- 
gilo um na primeira mas não na segunda. ? 
(e) Nenhum rei na primeira, segunda é terceira retiradas. 
U) ` Probabilidade de ocorrer um rei na primeira ¢ na seg! nda retiradas ou 
de não ucórrer nenbum na se runda setirada e um nã tercei 
8 . 


Uma bola de gude é retirada, 20 acaso, de uma urna que contém 10 ver 
acas, 20 amis e 15 alaranjadas. Determinar a probabili ado de 
(a) alaraniadas ou vermelhas; (b) nem vi n (e) di- 


(e) 1/15; (d) 2 


de são retirada: 
` ituíd: 
de: (a) ambas serem br 
segunda (e) nenhuma ser Maron) 
ou ambas (vermelha ¢ branca); (e) a segunda não ser agul (Q) a primeir 
{h) no dmo uma ser vermelha; (Da 
(5) apenas uma, ser vermelha, 
(d) 64/225; (e) 11/15; Q) 15; 


ue 


Wa pr 
(d) serem vo molhas, brancas, 
rã ser 


alaranjada; (9) ao menos uma 
s a segunda 
Cb) aT; (0) 168 
5; () 625; G 


primeira ser branca 


Resp: (0) 412; 
(9) 104/225; Ch) 

44. Resolver O 
retirada. 

Resp: (e) 29/185; Œ) 287; (O 118/185; (0) 52/185; (o) i5; Q) i 
(g) 86/485; (4) 182/185; (5) 9/87; (9) 28/11. 


9 


plema anterior, se não houver restituição depois de cada 
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45. Determinar a probabilidade de se obter, em dois lances de um par de da- 
dos honestos, w fal de 7 pontos: (a) uma vez; (b) 20 menos uma vez; (c) duas 
vêzes. ` 


Resp: (a) 5/8; (Æ) 14/36; (0) 1/36. 


46. Dyas cartas são retiradas, sucessivamente, de um baralho comum de 
52 cartas bem embaralhadas. Determinar a probabilidade de: (a) a primeira 


carta não ser um-30 de-copas ou um és; (b) à primeira carta ser um ás, mas & 
segunda não; (c) àp menos uma carta ser de ouros; (d) as cartas não serem 
do mesmo naipe; ` (e) não mais de uma carta ser uma figura (valete, dama, rei); 
U) a segunda carta não ser uma figura; (g) è segunda carta não ser uma dada 
figura, depois de ter surgido uma figura na primeira; (A) as cartas serem 
figuras ou de espadas ou arabas, . 

Resp: (a) 47/52; (Œ) 16/221; (c) 15/84; (d) 13/17; (e) 210/221; Q) 1008 
(9) 40/51; (A) 77/442. . s 


47. Uma urna contém 9 talões numerados de 1 a 9, inclusive. Se 3 ta- 
lões são retirados da urna, um de cada vez, determinar a probabilidade dêles se- 
rem, alternadamente, fmpar, par, ímpar ou par, impar, per. 

Resp: 5/18. 


48. As vantagens favoráveis à vitória de A contra B, em um jôgo de xa- 
drez, são de 3:2.. Se forem realizados 3 jogos, quais serão as vantagens: (a) fa- 
voráveis a que 4 vença pelo menos 2 dos 3 jogos; (b) contrários a que Á perca 
as duas primeiras partidas para B? 


Resp: (a) 81:44; (b) 21:14. 


49. Uma bólsa contém 2 moedas de prata e 4 de cobre, e uma segunda con- 
tém 4 de prata e 3 de cobre. Se uma moeda é selecionada, a0 acaso, de uma das 
duas bôlsas, qual é a probabilidade dela ser de prata ? 


Resp.: 19/42. , 


50. A probabilidade de um homem estar vivo daqui a 25 anos é de 3/5, e i 


a de sua mulher também o estar, na mesma ocasião, é de 2/3. Determinar a pro- 
babilidade de: (a) ambos estarem vivos; (b) sômente o homem estar vivo; (c) sô” 
mente a mulher estar viva; (d) pelo menos um estar vivo. 


Rsp.: (a) 2/5; (b) 1/5; (e) 4/15; (d) 13/15. 


51. Entre 800 famílias com 4 crianças cada uma, que percentagem se espe- 
raria que tenha; (4) 2 meninos e 2 meninas; (L) 20 menos um menino; tc) nenhuma 
menina; (d).no máximo duas meninas? Admitir probabilidades iguais para me- 
ninos e meninas, 2 

Resp: (0):37,5%; (b) 93,75%; (e) 6,25%; (d) 68,75%. 


Distribuição de' probabilidade 


52. Se X é uma variável slestória que representa o número de meninos de 
uma família com-4 crianças (veja Probl, 51): (a) construir uma tabela que mostre: 
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a distribuição de probabilidade de X; (b) representar graficamente $ distribuição 


do item (e). 


x [004 2 3 $ 


Resp: (0) — . 
woo | s 416 6/6 aje 116 


tinua X, que pode assumir sòmente valore 8 
compreendidos entre 2 e 8, inclusive, tem uma função de densidade A 
«X + 3), em que a é uma constante. (a) Calcular a. (b) Determinar Pr {3 < 
<5). (e) Determinar Pr( X24). (d) Determinar PrtiX — 5I< 0,5). 

Resp.: (a) 1/48; (0) 7/24; (0) 3/4; (a) 1/6. 

ã i ituição, de uma urna que con- 

54. Três bolas de gude são retiradas, sem restituição, de 

tém 4 vermelhas e 6 brancas. Se X é ums variável aleatória que representa O 


y į reti : truir uma tabela que mostre & 
total de bolas de gude vermelhas retiradas: (a) construir ue most 
distribuição de probabilidade de X; (b) representar graficamente essa distribuição. 


53. Uma variável aleatória con 


Resp.: (a) 
12 3/10 1/30 


emanean aaaea 


g5, Para o problema anterior, determinar: (a) Pr 
e interpretar, 

Resp.: (a) 3/10; € 8 probabilidade de retirar-se um total 
vermelhas; (b). 5/6; é & probabilidade de retirada dê 1, 2 ou 
isto é, retirando-se so mehos uma vermelha. 


de 2 bolas de gude 
3-bolas vermelhas, 


Esperança matemática 


justo a pagar para entrar em um jôgo no qual se pode 


56. Qual é o preço ironia At 


ganhar UBS 25 com 3 probabilidade de 0,2 e Us! 
Resp: USS 9. ý 
57. Se chove, um vendedor de gusrda-chuvas pode ganhar US$ 30 por pra 
Se houvêr bom tempo, êle pode perder US$ 6 por dia. Qual é sua esperança, Se 
probabilidade de chuva é de 0,3? 
Resp.: US$ 4,80 por dia. 
se. Ae B jogem uma partida, na qual lançam uws moeda honesto 3 vêzes. 
O que obtiver cara em primeiro logar, vencerá e portida, Se 4 éo primeiro & 
Jangar a moeda e se O valor total das apostas é US820, qual deve ser 2 contribuição 
de cede um, para que o jôgo possa ser considerado correte ? : 
Resp: À, USS 12,50; B, US$ 7,50. 


ah O PLS ESB 
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59. Determinar; (a) BCE); (b) EGO); (0) EKX — Fy); (a) E(X? uinte 
distribuição de probabilidade: E IET AEE ED 


X — 10 — 20 30 


AX) 1/5 3/10 12 


Resp.: (e) 7; (b). 590; (c) 541; (d) 10 900. 


. 50, Determinar: (a) a média; (b) a variância; (e) o desvio padrão da distri- 
buição de X do Probl. 54 e interpretar os resultados. 


Resp.: (0) 1,2; (b) 0,58; (0) V/0,56 = 0,75. 

6l. Uma variável aleatória assume o valor 1 com a probabilidade p.e O 
com a probabilidade q = 1 — p. Provar que: (a) E(X) = p; (b) EKZ — Xl= 
= pg. 


62. Provar que: (u) E(X +3) = 2E ; EX — 33] = K(X 
SIRER ) (X) +3; (0) EX — E) = E(X) — 


63. Sejam X e Y duas variáveis aleatórias que tê Pa 
Mostrar que E(X + Y) = A(X) + E). que têm'g mesma distribuição . 


Permutações 


68, Calcular: (a) Pe; (b) 1Ps; (e)oPa. 
Resp.» (a) 12; (b) 2 250; (e) 720. 


65. Para que valor de n verifica-se £ igualdade (n¢1)Pa = nP4? 
Resp: n=5. 


66. De quantas maneiras 5 pessoas podem sentar-se em um sofá se houver 
apenas 3 lugares disponíveis. 


Resp.: GO. 


67. De quantas maneiras 7 livros podem ser arrumados em uma prateleira 
se: (a) qualquer arranjo é possível; (b) 3 livros indicados devem estar sempre 
juntos; (c) 2 livros indicados devem ocupar as extremidades. 


Resp: (e) 5 040; (b) 720; (0) 240. 


j 68. Quantos números de 5 algarismos cada um podem ser compostos com os 
algarismos se: ú f 

garismos 1, 2, 3, - . » , 9 se: (e) os números devem ser ímpares; (b) os dois primeiros 
algarismos de cada número são pares? i 


Resp. (a) 8 400; (b) 2 520. 


9, Resolva o problema anterior, se forera permitidas as repetições do alga- 
6 4 ble: ntorior, se forem p iidãs a t e 
4i pi f S cti o alg 


Resp.: (a) 32 805; (b) 11 684. 
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70. Quantos números diferentes de 3 algarismos podem ser formados com 3 
quatro, 4 doise 2 três? 

Resp.: 20. 

71. De quantas maneiras 3 homens e 3 mulheres podem sentar-se 20 redor 
de uma mesa se: (a) nenhuma restrição é imposta; (b) dois homens indicados não 


. podem sentar-se juntos; (c) cada mulher deve estar entre 2 homens ? 


Resp.: (a) 120; (b) 72; (0) 12. 


Combinações 

42. Calcular: (a) Cs; (6) Cs (0) 1003- 

Resp: (a) 10; (b) 70; (e) i5. 

73. Para que valor de n se verifica a igualdade Bm = T-n0a? 

Resp: n = ô. 

74. De quantas maneiras 6 questões podem ser selecionadas entre 10? 

Resp: 210. 

“ 95. Quantas comissões diferentes “de 3 homens e 4 mulheres podem ser for- 
madas dentre 8 homens e 6 mulheres ? E 

Resp.: 840. 

76. De quantas maneiras -2 homens, 4 mulheres, 3 meninos e 3 meninas 
podem ser escolhidos entre 6 homens, 8 mulheres, 4 meninos e 5 meninas se: 
(a) nenhuma restrição é imposta; (b) um homem e uma mulher indicados devem 
ser escolhidos ? 

Resp.: (a) 42 000; (b) 7000. 

77. De quantas maneiras um grupo de 10 pessoas pode ser dividido em: (a) 
2 grupos constituídos de 7 e 3 pessoas; (b) 3 grupos constituídos de 4, 3 e 2 pessoas ? 

Resp.: (a) 120; (b) 12 600. 


78. Deve ser formada uma comissão constituída de 2 estatísticos e 3 econo- 
mistas, escolhidos dentre 5 estatísticos e 6 economistas. Quantas comissões dife- 
rentes podem ser formadas se: (a) nenhuma restrição é imposta; (b) 2 estatísticos 
indicados devem estar na comissão; (c) um economista indicado não pode estar 
na comissão? 


Resp.: (a) 150; (b) 45; (c) 100. 


79. Determinar o número de: (a) combinações; (b) permutações, de 3 
etras cada ums, que se pode formar com às lettas da palavra Tennessee? 

Resp.: (0) 17; (b) 163. 

20. Provar que 1 — ali + Ca ala deco (IP ala = O 


Agrozissação de Stirling para z} 


81. De quantes maneiras 30 indivíduos podem ser escolhidos entre 100? 
Resp: 2,95 X 10%, 
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82. Mostrar -que mOn = PASEN, aproximadamente, para grandes valores 
de n : e YA 


Problemas diversos 


83. Três cartas são retiradas de um baralho de 52 cartas. Determinar a 
probabilidade de: (a)-2 serem valetes e 1 rei; (b) tôdas as cartas serem do mesmo 
naipe; (c) tôdas as cartas serem de naipes diferentes; (d) serem retirados so 
menos 2 ases. i 


Resp.: (a) 6/5 525; (b) 22/425; (c) 169/425; (d) 73/5 525. 


84. Determinar a probabilidade de se obter pelo menos dois 7, em quatro 
lances de um par de dados. 


Resp.: 171/1 296. 


85. Se 10% dos rebites produzidos por uma máquina são defeituosos, qual é 
a probabilidade de, entre 5 escolhidos ao acaso: (a) nenhum ser defeituoso; (b) 
um ser defeituoso; (c) pelo menos 2 serem defeituosos? 


Resp.: (a) 0,59049; (b) 0,32805; (c) 0,08146. 


86. (a). Construir um espaço amostral para os resultados de 2 lances de uma 
moeda honesta, adotando 1 para representar “caras” e O para representar “coroas”. 
(b) Por meio dêsse espaço amostral, determinar a probabilidade de pelo menos 
uma cara. (c) Pode-se construir um espaço amostral para os resultados de 3 lances 
de uma moeda? Se o fôr, determinar, com sus ajuda, a probabilidade de, no 
máximo, 2 caras. 


Resp: (b) 3/4; (0) 7/8, 


87. Uma prévia eleitoral entre 200 eleitores revelou as seguintes informações 
a respeito de 3 candidatos, A, B e C, de um certo partido, que concorrem s três 
cargos diferentes. 


28 a favor de ambos, 4 e B; ; 

98 a favor de. A, ou de B, mas não de C; 
42 a favor de B, mas não de A ou de C; 
122 à favor de B, ou de C, mas não de A; 
64 a favor de C, mas não de 4 ou de B; 
14 a favor de 4 e de €, mas não de B. 


Quantos eleitores foram a favor de: (a)os 3 candidatos; (b) 4, independente- 
mente de B ou de C; (c) B, independentemente de 4 ou de O; (d) C, independente- 
mente de 4 ou de B; (e) 4 e de B, mas não de C; (f) apenas um dos candidatos? 

Resp.: (a) 8; (b) 78; (c) 86; (d) 102; (e) 20; (f) 142. 


88. (a) Provar que, para quaisquer-eventos, Bje Eº, PriE, + En S Prig) + 
+ PriZo). (b) Generalizar o resultado do item (a). ` 


89. Sejam E, Ær, Es três eventos diferentes, dos quais pelo menos um tenhs 
ocorrido. Suponha-se que qualquer dêstes eventos pode resultar em outro evento 
A, que também sè sabe que tenha ocorrido. Se tôdas as probabilidades Pr{ E}, 
Pr Eat, Pri Es) Pr{A]E], PriAi Ea), Pr [A [Es] são consideradas conhecidas, 
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provar que: | 
j Pr {En} Pr (Alit i 
Pr {Éld} = Pr (Eu Pr (4 En E Pr (Ea) Pr {4l En +Pr TE PriÁ io 


com resutiados semelhantes para PriEal4) e Pr {E JAL. Isso é ja 
como teorema ou regra de Bayes. É útil para o cálculo das probabilidades das várias 
hipóteses En, Ez ou Es que dão como resultado o evento 4. O resultado pode ser 
generalizado. 


90. Cada uma de três caixas de jóias idênticas tem 2 gave tas. Em cada pesa 

da primeira caixa há um relógio de ouro. Em cada gaveta da segunda há um E 

rato. Em uma das gavetas da terceira caixa há um relógio de ouro, enquanto 
quê a outra há um de prata. Se fôr escolhida uma caixa ao acaso, aberta umae 
das gavetas € encontrado um relógio de prata, qual é a probabilidade do que & 
outra gaveta contenha um de ouro? (Sugestão: aplicar o Probl, 89.) 

Resp.: 1/3. 

91. A e B decidem encontrar-se entre 15 e 16 horas, mas cada um Ro a 
raria mais do que 10 minutos pelo outro. Determinar a probabilidade dêles se 
encontrarem. 

Resp: 11/36. 

92. Dois pontos são escolhidos ao acaso sôbre um segmento de reta, a 
comprimento é a > 0. Determinar a probabilidade dos 3 segmentos assim formado! 
póderem ser os lados de um triângulo. 

Resp.: 1/4. 


CaríruLo 7 


AS DISTRIBUIÇÕES BINOMIAL, NORMAL 
E DE POISSON 


A distribuição binomial 


< Se p é a probabilidade de um evento acontecer em uma tenta- 
tiva única (denominada probabilidade de um sucesso) e q =} — p 
é a de que o evento não ocorra em qualquer tentativa única (deno- 
minada probabilidade de um insucesso), então a probabilidade do 
evento ocorrer exataámente X vêzes, em N tentativas (isto é,.de que 
haja X sucessos e N — X insucessos), é dada por: dis 


POD) = Orpo- = A! more 
nexpég XIW- pXqu-x, a) 


em que X = 0, 1,2, ..., N e N= NN ~ DN -Ji 
0! = 1, por definição (ver o Capítulo 6, Prob. 34). 


Exemplo 1. A probabilidade de obter exatamente 2 caras em lances de uma 
a 6 de 


TOKON o 

2 2 zlat (27 “oa 
substituindo em (1) os valores N = 6, X = 2e p=q= d 
7 


Exeroplo 2. A probabilidade d "mé 
ERRA SAO de obter ao menos 4 caras em 6 lances de ums 


134 7164 5 

ai (5) (5) Gra (5) fl i (5) ata 
2 + Gs a Gli) DB, 8,1 H 
2 2) do) +6 tata 
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A distribuição discreta de probabilidade (1) é denominada, fre- 
qiientemente, distribuição binomial, visto que a X 70, 1, 2,..0 N 
correspondem os têrmos sucessivos da jórmula binomial ou do desen- 


volvimento binomial 
(+ DN = qu + ngpi o dp) 


em que 1, nO Ca -.. São denominados coeficientes binomiais. 


Exemplo: 

(q + p = gt Hagn + aC? + «Cagp? + pt = 
= q! + 4gp + 6gp? + agp" + pt. 

A distribuição: (1) é também denominada, distribuição de Ber- 
noulli, porque foi James Bernoulli quem a descobriu, no fim do sé-, 
culo XVII. 

Algumas propriedades da distribuição binomial estão re- 


lacionadas na seguinte tabela: s 


Tabela 7.1 


ir eim 


Média 
Cias Variância as 
Desvio padrão o = vV Npg 
Coeficiente do momento de assimetria s= LZE 
V Neg 
à mig E SPA 


Coeficiente do momento de curtose NA 


lia do número de caras 


Exemplo: Em 100 lances de ums moeda honesta, a méd 
caras em 100 lances 


é u = Np = (100) (4) = 50. Ésse éo número esperado de 
da moeda. O desvio padrão é o = VNp = VOW G) G) = 5. 


A distribuição mormal 


Um dos mais importantes exemplos de uma distribuição continue, 
de probabilidade é a distribuição ou a curva normál, ou & distribuição 
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de Gauss, definida pela equação: 


1 ] 
Y = —— a CYNK- 
rod (3) 


na qual 4 = média, q = desvio padrão, m = 3,14159 = 
= 271828... ' nro 

A área total limitada pela curva (3) e pelo eixo dos X é igual 
a l; portanto, aare sob a curva, compreendida entre as duas coor- 
denadas X =de X =b, em que a < b, representa a probabilidade 
de X estar situado entre a e b, representada por Prfa < X < b}. 

Quando -a variável X é expressa em têrmos de unidade redu- 


zida; 2 = (X — w/o, a equação (3) é substituíd. i 
Ra > ) stituída pela denominada 


t a 
cy A (4) 


Nesse caso, diz-se que z é normalmente distribuído, com média 
zero e variância 1, 3 f 

Um gráfico desta curva normal reduzida estóvindicado na Fig. 7-1. 
nE gráfico; estão indicadas as áreas incluídas entre 2 = — le 

z= — 2 e +2, 2=—-3 e+3, iguai i 

, 3, iguais, respectivamente; a 
68,27%, 95,45% e 99,73% da área total que é unitária. i 


aom 88, 27 Jo — è 
95,45% 
99,13% 


Fig. 7-1 


Apresenta-se no Apêndice II uma tabela que dá as ireas sob 
essa curva, compreendidas entre a ordenada z = 0.6 qualquer" 
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Por meio dessa tabela pode-se determinar 


valor positivo de 2. 
a área entre duas coordenadas quaisquer, em vista da simetria da 


curva em relação a z = 0. 
Algumas propriedades da distribuição mormal, represen- 
tada pela Equação (3), estão relacionadas na Tabela 7.2. 


Tabela 7.2 
dns T 
Média p 
e = 
Variância o? 
Desvio padrão Ci 
Coeficiente de momento de assimetria) az= 0 
= A gi 
Coeficiente de momento de curtose a= 3 
Desvio médio ov/3fr = 0,19790 


Relação entre as distribuições binomial e normal l 


Se N fôr grande, e se nem p nem q estiverem muito próximos 


de zero, a distribuição binomial pode ser bastante aproximada de 
uma normal, cuja variável reduzida será dada por 2 = Z zae, 
vV Ñpg 


A aproximação melhora com o crescimento de N, e no caso limite 
há a coincidência. Isso está indicado nas Tabelas 71 e 7.2, nas 
quais está evidente que, à medida que N aumenta, à assimetria € & 
curtose da distribuição binomial tendem para as da normal. Na 
prática, a aproximação é muito boa, quando tanto Np como Nq são 
superiores à 5. 


Distribuição de Poisson 
A distribuição discreta de probabilidade: 


NE e 


=v  E=0133..) (5) 


em que e = 2,11828 ... e À é uma constante dada, é denominada. 
distribuição de Poisson, por ter sido Poisson quem a descobriu, no 
comêço do século XIX. 
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Os valores de p(X) podem ser calculados mediante o emprêgo 
do Apêndice VI, que dá os valores de, e para vários valo- 


res de À, ou por meio de logaritmos. . 


Algumas propriedades da distribuição de Poisson 


“Algumas propriedades da distribuição de Poisson estão relacio- 
nadas na tabela seguinte. 


Tabela 7.3 
Média =À 
Pa), 
riypi 3 a 
Desvio padrão o =vA 
Coeficiente de momento de assimetria az = YVA 
Coeficiente de momento de curtose as = 34 1A 
A 


Relação entre as distribuições binomial e de Poisson, 


. Na distribuição binomial (1), se N fôr grande, enquanto que a 
probabilidade p da ocorrência de um evento fôr próxima dé zéro; 
de modo que q = (1 — p) tende para 1, o evento será denominado 


raro. Na prática, considera-se um evento como raro quando o nú-" 


mero de tentativas é, pelo menos, igual a 50 (N = 50), ao passo que 


Np é menor do que 5. Nesses casos, a distribuição binomial (1) é: 
muito aproximada da de Poisson (5), com À = Np. Isso é indicado . 


mediante a comparação das Tabelas 7.1 e 7.3 porque, fazendo-se 
A=Npq=lep= o, na Tabela 7.1, obtêm-se os resultados 
da Tabela 7.3. 

Como há uma relação entre as distribuições binomial e normal, 
conclui-se que também há uma relação entre as de Poisson e a nor- 
mal. Realmente, pode-se demonstrar que a distribuição de Poisson 
se aproxima de uma normal, com a variável reduzida (X — AIVA, 
quando À cresce indefinidamente. É 


A distribuição polinomial 


Se os eventos Ei, Es, ..., Ex podem ocorrer com as probabili- 
dades Pi Pa -.., Pk, respectivamente, então a probabilidade de 
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Rea vai g- 
E, Es , Ex ocorrerem Xu Xo -n XK vêzes, respectivamente, é: 
Ën o É Ê 
3 
é 1 
o pr, © 
- REA po AK K 


em que Xi HX +... +Xg=N. 
Essa distribuição, que é uma gen 

minada distribuição polinomial, visto que (6) é é 

desenvolvimento do polinômio (Pı + Pz +... + par. 

to é lançado 12 vêzes, & probabilidade de serem 

exatamente duas vêzes cada um, é: 


eralização da binomial, é deno- 
o têrmo geral do 


Exemplo: Se um dado hones 
obtidos os pontos 1, 2, 3 L, 5e6, 


OO OO O E 
21212121212! \6 6 6 67: 16 6 559 87 


.» Ex 


Os números esperados de vêzes das ocorrências de Es By 
em N tentativas são NP Npy -oop Npks respectivamente. 
Ajustamento das distribuições teóricas às distribuições de. 
freguências das amostras 


Quando se tem alguma informação sôbre a distribuição de pista 
população por meio de um raciocínio probabilístico, ou de ars 
qualquer modo, é frequentemente possível ajustar-se" essas distribui- 
ções teóricas (também denominadas distribuições 1 
peradas”) às de frequência, obtidas de uma amostra da população. 
O método geralmente adotado consiste no emprégo da média € do 
desvio padrão da amostra para à estimativa dêsses elementos da 
população (veja os Probis. 31, 33 e 34). 

Para verificar a aderência do ajustamento das distribuições teó- 
ricas, emprega-se O teste de qui-quadrado, apresentado nO Capítulo 12. 

A fim de se determinar se uma distribuição normal representa 
um bom ajustamento para Os dados obtidos, é conveniente usar-se o 
papel dé curva normal ou de probabilidade, como às vêzes é denomi- 

y nado (veja o Probl. 32). 


Problemas Resolvidos 
A distribuição binomial 


8! 
1. Calcular: (a) 5!; ©) zrg (0) sOs (8) «Cs; (© Cu Q) Oo 


“God élo"ou- AE ra 
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= E = 15 
(6) Gs = TES z7 PE EAN EEEN - a = 56 
(d) 705 = E = CE = = = 21, 
(e) Ci = ai = | (visto que, por definição, O= 1). 
G) 4Co -r =1. 


2. Determinar a probabilidade de, ao lançar três vêzes uma 
moeda honesta, aparecerem: (a) 3 caras; (b) 2 caras e 1 coroa; 
(e) 2 coroas e 1 cara; (d) 3 coroas: 

Solução: 

1.º método: 


Sejam H as “caras” e T as “coroas” e suponha-se que HTH, por exemplo, 
significa cara no primeiro lance, coroa no segundo e cara no terceiro. 


Como as 2 possibilidades (cara ou coroa) podem ocorrer em cada lance, há um 
total de (22X2) = 8 resultados possíveis. Elas são: 


HHH, HET, HTH, UTT, TTH, THH, TRT, TTT. 


Como cada uma dèssas possibilidades é igualmente provável, a probabilidade 
de cada uma é 1/8. 


(a) 3 caras (HHH) ocorrem sômente uma vez; então, a probabilidade de 3 
caras é 1/8. 


(b) 2 caras e 1. coroa ocorrem três vêzes (HHT, HTH-e THH}; então: 
Pr {2 caras e 1 coroa} = 3/8. 
(e) 2 cordas e Í cara ocorrem três vêzes (HTT, TTH e THT); então: 
e Pr(2 coroase 1 cara} = 3/8. É 
(8) 3 coroas PTD) ocorrem apenas uma vez; então: 


Pr {TTT} = Pr {3 coroas} = 1/8.. 


|. 
k 
i 
t 
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aium = e (Dc) DE 
POLOO 


Pode-se também proceder como no Capítulo 6, Probl. 10. ; 
um dado 
3. Determinar a probabilidade de, em 5 lances de 


b) duas 
honesto, aparecer um 3: (a) nenhuma vez; ©) uma Ee (e) 
vêzes; “a três vêzes; (e) quatro vêzes; (j) cinco vêzes. 


(a) Pr 8 caras) 


(d) Pr {3 coroas) 


Solução: 


Probabilidade de 3 em uma única jogada = p = 1/6. 


ica j = 5/6. Então: 
Probabilidade de nenbum 3 em uma única jogada = q = 1-p=5 


5 i 5 3125 
(a) Pr (3 ocorrer nenhuma vez) = 500 GYGY = 00 (Oi 4T aTi 


(b) Pr (3 ocorrer uma vez) «= 501 (5 1y 6) - 


14? (0) G HG- 
(c) Pr {3 ocorrer duas vêzes} = sC2 ($) y- 36/ \216 


3 888 
1y% 2y- li (E = 
(d) Pr {3 ocorrer três vêzes} =508 (+) (5) = (10) lag) \36 
125. 
“3 3888 


no 


o Pr (3 ocorrer quatro via = 04 (5 y (é 5y 


a0 (rx a) (é EE 
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(U) Pr {3 ocorrer cinco vêzes) = afty EY as 
3 6 67 — 


geo, mi! o ATT 


Note-se que essas babili i 
Os probabilidade: e 
do binômio: des representam os têrmos do desenvolvimento 


Gr) ra) ra (O) 
tea (6) a (5) (5) + (6)! 


4. Escrever os desenvolvi f j i 
PE rolvimentos dos binômios: (a) (g + p)!; 


Solução: | 
LE 2 
(a) ta +p) ) HaCigêp + aCagtp? + Cago? + pt = 
= qt + 4gp + 6gp? + agp! + pt, 
(0) (ap = a troca 
a +p) € F Cag p + eCagip? + sCagp? + Cag pt + eCsgp* + pt = 
== q" + 6gp + 15qfp? + 209ºp? + 150°p* + Ggp* + p° 


DAS 1 
Ea 1 são denominados coeficientes SE 2 ! 1 ii 
£ is correspondentes 8 N=4 e i 3 3 1 
=6, respectivamente. Escrevendo-se 1 4 8 4 1l 
ĉsses coeficientes, pára N = 0,1,2,3,..., 1 À $ 10 1 5 1 


como está representado à direita, obtém-se $ 15 20 15 6 1 


um dispositi i ùi 
sra o ano triângulo de Pascal. Note-se que o primeiro e o últi 
aa eiro e 
Paa Ras fila f 1 8 que qualquer outro pode ser obtido, diante, % San 
3, um à direita e outro à esquerda, da fila precedente TE 


5. rmi ili 
ps Dias probabilidade de em uma família de 4 crian 
é o (a) im menos um menino; (b) pelo menos um meno 

nina. miti ili aci 
dao Ge di r que a probabilidade do nascimento de um 


Solução: 


(a) Pr {1 menino} = 464 GY GY e 
a 4 
) 


Pr {2 meninos) = «Cy GYG ANE: 
27 8 
` 
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118 1 
= Pr [3 meninos} = «Cs (5) (5) = + 


a . 134/09 1 
Pr {4 meninos) = 40s (4) (5) =10 


} = Pr {1 menino) + Pr {2 meninos) + 
i i dg E E E 
+ Pr (3 meninos) + Pr lá meninos} = 73 TR 


Então, Pr fao snenos 1 menino 


„Outro método: 


i 
Pr {ao menos 1 menino) = 1 — Pr {nenhum menino) = 1 — (1) = 


(b) Pr {ao menos 1 menino e 1 menina) = 1 — Pr {nenhum menino) — 


— Pr {nenhuma menina) = 1 — ETA -i =5' 


6. Entre 2 000 familias com 4 crianças cada uma, quantas se 
esperaria que tivessem: (a) pelo menos 1 menino; (b) 2 meninos; 
(c) 1 ou 2 meninas; (d) nenhuma menina? Reportar-se ao Probl. 5(a). 


Solução: 


(a) Número esperado de” famílias comy- pelo. menos, um menino =... 


(b) Número esperado de famílias com 2 meninos = 2 000 x Prt2 meninos) = 


= 2 000 (5) = 750. 


(c) Prfl ou 2 meninas) = Pr {1 menina) + Prt2 meninas) = Prii menino) + 


x 1 3 5 
+ Pr{2 meninos) = r FIER 


Número esperado de famílias com 1 ou 2 meninas = 2000 (5) = 1 250. 


(d) Número esperado de famílias com nenhuma menina = 2 000 (1) = 125. 


7. Se 20% dos parafusos produzidos por uma máquina são 
defeituosos, determinar a probabilidade de, entre 4 parafusos esco- 


lhidos ao acaso: (a) l; tb) 0; (e) no máximo 2 parafusos serem 


- defeituosos. 
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Solução: 


A probabi idade de ocorrer um parafuso defeituoso: de p=0,2e um não- 
-defeituoso é d = 1] — p = 0,8. 


(a) Prtt palafuso defeituoso entre 4) = «Cy(0,2)10, a = 0,4096. 
(6) Pr [henhym parafuso defeituoso) = 4Co(0,2)%0,8)! = 0,4096 
(e) Pr(2 parafusos defeituosos} = = 4C2(0,2)°(0,8)? = 0,1536. 


Então, Prfao menos 2 parafusos def.) = Pr( nenhum parafuso def.) + Pr{1 
parafuso def.) + Prf2 parafuso def.) = = 0,4096 + 0,4096 + 0,1536 = 0,9728 


8 A probabilidade de um estudante, que ingressa em um co- 
légio, de graduar-se é de 0,4. Determinar a probabilidade de, entre 
5 estudantes: (a) nenhum; (b) um; (c) pelo menos um graduar-se. 


Solução 3 


(a) Prinenhum graduar-se) = sCo(0,80,6) = 0,07776 ou, - aproximada- 
mente, 0,08. $ 


(b) PrlL graduar-se} = 5Ci(0,4)H0,6)t = 0,2592 ou, aproximadamente, 0,26. 


(c) Pripelo menos um graduarse} = | — Prinenhum graduar-se) = 0,92224 
ou, aproximadamente, 0,92, 


9. Quais são as probabilidades de obterem-se 9 pontos, em 
seis lances de um par de dados: (a) duas vêzes; (b) pelo menos 
2 vêzes? 


Solução: 


“Cada uma das 6 maneiras, segundo as quais o primeiro dado pode cair, pode 
ser associada a cada uma das 6 maneiras do segundo, de modo que há 6 X 6 = 36 
maneiras para ambos os dados. São elas: 1 no primeiro e 1 no segundo, 1 no 
primeiro e 2 no segundo ete., ... representadas por (1,1), (1,2) ete. 


Destas 36 maneiras, tódas iaidd prováveis, se os dados forem honestos, 
o total 9 ocorre em 4 casos: (3,0), (4,5), (5,4) e (6,3). Então, a probabilidade de 


um total O em tim lance único do par de dados é P = 4/36 = 1/9 e a de não ser 
obtido aquêle total é de q=1 — p= 8/9. 


Ai IN? ( 8% 61440 | 
(a) Prídois 9 em 6 lances) =a (5 ) (5 ) = ELA 


(6) Prípelo menos dois 9) = Prídois 9} + Prltrês 9) + Pr {quatro 9) + 
+ Prícinco 9) + Pr {seis 9) = 


G sa (Dra (o (8) 


ëg, 19º 61440 , 10240 960 
9 E) = gran tsia Pag + 


48` E 1 72689 
s81441 Csgiaa ~ 5314 


empre tapar matam 
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Outro método: 


Fripelô menos dois 9) = 1 — Prínenhum 9) — Prlum 9) = 
l é 72680 
-i-a GG -eO G) “BATAL 


N N = 
10. Calcular: (a) È, xp (0; (db) È rt, onde 7(X) = 


= wlxpHqNX, 
Solução: 
y X p NI XgN-X a 
o E ACO = A N-D 


O N-I! O raga a 
-v ce HN- 01? q 


= Nola + p) = Np, visto. que q +p = 1. 


a NL NX a 
® T aa = Èr a aT P*a 


X=0 
N N! HË a 
-XIa -D+ ESA 


N! XgN-X + 
- xa- DN- i”. 


XaN-X a 
+Exqas mr 


No BD! N-X 4 Np = 
= MN = D apom N 


= NW = Pa +p)? + Np = MN = 1) + Np 


Nora: Os resultados dos itens (a) e (b) são.as esperanças de X e X?, repre- 
sentadas por E(X) e E(X?}, respectivamente (veja o Capítulo 6). 


11. Se uma variável tem distribuição binomial, determinar 
sua: (a) média p; (©) variância o°. 


5 EENAA a S A T p PD TER Sli 
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Solução: 


N š 
(a) p = esperança da variável, = 5 XxX) = Np, segundo o Probl. 10la). 


N N 
(b) = D (X PAX) = DO X — uX + pX) = 
X=0 X=0 


N N N 
= $ LMX) — 2u $ XX) + D p= 
X=0 X=0 X=0 f 


= MN — 1)p? + Np = ANpXNp) + (NPR) = 
= Np — Np = Np — p)= Npq. 


adotando-se u = Np e os resultados do Probl. 10. Segue-se que q desvio padrão 
« de uma variável, cuja distribuição é binomial, é o = VNpq. 


Outro método: 


EX ~ E)? = E(X?) — EGO? = MN — Dp? + Np — Npº = Np- NP = 
= Npq, de acôrdo com o Probl. 62(b) do Capítulo 6. 


12. Se a probabilidade de ocorrer um parafuso defeituoso é de 
0,1 determinar, para um total de 400 parafusos: (a) a média; 
- (b)-o desvio padrão da distribuição, 


Solução: 


(a) Média = Np = 400(0,1) = 40, isto é, pode-se esperar, que 40 sejam de- 
feituosos. 
“(b) Variância = Npg = 400(0,1) (0,9) = 36. Então, o desvio padrão é = 
=V36 = 6," g 


13. Determinar os coeficientes dos momentos de: (a) assimetria; 
(b) curtose, da distribuição do Probi. 12. 


Solução: 


(a) Coeficiente do momento de assimetria = 4 ZP = SAO = 0,133. 
VNpg 


Como é positivo, & distribuição é desviada para s direita. 


(b) Coeficiente do momento de curtose = 


opä I-tpo a y ł — 60,1) 0,9) 


E = 301. 
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A distribuição é ligeiramente lepiotúrtica em relação à distri- 
huição normal (ligeiramente mais pontiaguda, veja o Capítulo 5). 


A distribuição normal 


14. Em um exame final de Matemática, a média foi 72 e o 
desvio padrão 15. Determinar a variável reduzida (isto é os graus 
expressos em unidades de desvio padrão) dos estudantes que obti- 
veram graus: (a) 60; (b) 98; (o) 72. i 


Solução: 

X=-X 
(a) 2 = A = 
Gas 


15. Com referência ao Probl. 14, determinar os graus corres- 
pondentes aos escores reduzidos: (a) —1; (b) 1,6: ` 


Solução: 
(a) X =F + zs = 72 + (~ 1X15) = 57. 

@) X =F + gs = 72 + (1,6) (15) = 96. 

16, Dois estudantes foram informados de que alcançaram às 
variáveis reduzidas de 0,8 é — 0,4, respectivamente, em um exame de 
múltipla escolha de inglês. Se seus graus foram 88 e 64, respecti- 
vamente, determinar a média e o desvio padrão dos graus do exame. 

Aplicando a equação X = K + es, para o primeiro estudante: (1) 88 = X + 
+ 0,85; para o segundo estudante: (2) 64 = X — 0,45. 
nédia = F 72 e desvio padrão s = 20. 


Resolvendo (1) e (2) simultâneamente: 


17. Determinar a órea limitada pela curva normal em 
cada um dos casos, (a) a (g), abaixo. Utilizar o apêndice I, 
(a) Entrez = 0 e z=1,2. 
No apêndice II, percorre-se a coluna z para baixo, até encontrar a casa 1,2. 
Então, segue-se à direita até a coluna que indica o valor zero. 
O resultado, 0,3849, é a área desejada e representa à probabilidade de z estar 
compreendida entre O e 1,2, representada por Pr{0 £ z £ 1,2). 
(b) Entre z= — 0,68 e 2z=0. 
Aves descjade = área entre 2 = 0 e z = 0,68 (por simetria). 


Para se determinar a área entre z = 0 e z = 0,68, percorre-se 2 coluna z para 
baixo, até a casa 0,6. Então, segue-se à direita até a coluna que indica o valor 8. 
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O resultado, 0,2517, é a área pedida e representa à probabilidade de z estar 
compreendida, ent, — 0,68 e O, representada por: Pri = 068 £2 S oi. 


(co) Entre = 0,46 e c=221. 

Area desej (área entre z = — 0,46 e 2 = 0) + (área entre z =0e 
2 = 2,21) = (área entre 2=0 e z= 0,46) + (área. entre 2z=0 e z= 221) = 
= O, 1772 + 0,4864 = 0,6636. 


eee 


0 a E -0,58 221 
Pig. 7-2(0) Fig. 7-2(c) 


Pie 24) siso) 
(d) Entre 2=081 e 2=1,94. 
Área pedida = (área entre z = Oez = 1,94) — (área entre z = 0e z = 0,81) = 
= 0,4738 — 0,2910 = 0,1828. 
(e) À esquerda ‘de z = — 0,6. 


Area pedida = (área à esquerda de 
z = 0) —(área entre z = — Û,6 e z = 0) = 
x = (área à esquerda de z= 0) — (área 
Fig. 7-2(e) entre z = 0 e z = 0,6) = 0,5 — 0,2258 = 
= 0,2742. q 


(9) À direita de z = — 1,28. 


Area pedida = (área entrez = — 1,28 
e2z=0)+(gres à direita de z™= 0) = 
= 0,3997 + 9,5 = 0,8997. 

É o mesmo que Pr fz E — 1,28). 


(9) À direita de z = 2,05 eà 
esquerda de z = — 1,44. 


Fig. 1-2) 


Área pedida = área total — (área 
entre z = —.1,44 e z = 0) — (área entre 
2m0 e z=2,05)=1 — 0,4251 — 0,4798 = 
= 1 — 0,9049 = 0,0951. 


- curva normal? 
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18. Determinar o valor, ou valores, de z em cada um dos cases 
de (a) a (e), nos quais as áreas referem-se às limitadas pela 


(a) A área entre 0 e z é 
0,3770. 


No Apêndice II, a casa 0,3770 está 
situada à direita da linha designada por 
11, e “sob a. coluna encabeçada por 6. 
Então, o valor desejado é z = 1,16. Fig. 72-30) 


Por simetria, — 1,16 é outro 
valor de z. Assim, 2 = = 1,16. 


(b) A área à esquerda de z 
é 0,8621.º ` 


Como & área é maior do que 0,5, 2 Fig. 7-3(b) 
deve ser positivo. 


Åren entre 0 e 2 = 0,8621 — 0,5 = 0,362], donde z = 1,09. 


i 


(0) A área entre — 1,5 e z 
é 0,0217. 
Se z fôsse positivo, a área seria maior 


do que a compreendida entre — 1,5 e 0, 
memo que é 0,4332; portanto, z deve ser ne- 


Ts z . 
Fig. 7-1) gativo. 
4.º caspe 2 é negativo, mas à dirci- 


ta de — 1,5. 
Área entre — 1,5 eg = (área entre 
— 1,56 0) — (área entre 0e2). 
0,0217 = 0,4332-(área entre De 2. 
Então, a área entro O é z= 0,4332— 
— 0,0217 = 0,4115, do qual z = — 1,35. 
2.º casos 2.6 negativo, mas À esquer- 
da de — 1,5. 


z- 


1,5 
Fig. 1-3(c2) 


Área entre z e — 1,5 = (área entre z è 0) — (área entre — 1,5 e 0). 
0,0217 = (área entre 0 e z) — 0,4332. 


Então, a área entre 0 € z = 0,0217 + 0,4332 = 0,4549 e 2 = — 1,694, obtido 
por interpolação linear; ou, com menor precisão, 2 = — 1,69, 


19. Determinar as ordenadas da curva normal pa 
= 0,84; b) z=- 127; (Q z=- 0,05. 


216 É ESTATÍSTICA 


Solução : 


(a) No Apêndice I, percorre-se a coluna z para baixo, até encontrar a casa 
. 0,8. Então, segie-se à direita até a coluna assinalada por 4. A càsa 0,2803 é a 
ordenada desejada. Ear 


(b) Por simetria: (a ordenada em z = — 1,27) = (ordenada em z = 1,27) = 
= 0,1781. 


(c) (Ordenada em z = — 0,05) = (ordenada em z = 0,05) = 0,3984. 


20. O pêso médio de 500 estudantes do sexo masculino, de uma 
determinada universidade, é 75,5 kg e o desvio padrão é 7,5 kg. Ad- 
mitindo-se que os pesos estão distribuídos normalmente, determinar 
quantos estudantes pesam: (a) entre 60 e 77,5 kg; (b) mais do que 
92,5 kg. 


Solução: 


(a) Os pesos relacionados entre 60.8 77,5 kg podem ter, na realidade, qualquer 
valor compreendido entre 59,75 e 77,75 kg, admitindo-se que foram registrados 
até centésimos. 


| 59,75 kg em unidades reduzidas = (59,75 — 75,50)/7,5 = — 2,10. 
77,75 kg em unidades reduzidas = (77,75 — 75,50)/7,5 = 0,80. 


A proporção desejada de estudantes = (área entre z = — 2,10e 2 = 0,30) = 
= (área entre z = — 2,10 e 2 = 0) + (área entro z = 0e x = 0,30) = 0,4821 + 
“+.0,1179.=: 0,6000.... Então, .o número. de. estudantes cujos-pesos estão entre 60 
e 77,50 kg = 500 X (0,6000) = 300. , 


(b) Os estudantes com pesos superiores a 92,50 kg devem pesar pelo menos 
fi 92,75 kg. ` 


92,75 kg em unidades reduzidas = (92,75 — 75,50)/7,5 = 2,30. 


A proporção desejada de estudantes = (área à direita de z = 2,30) = (área 
à direita de z = 0) — (área entre z = 0 e z =-2,80) = 0,5 — 0,4893 = 0,0107. 


IN 
LN 


DA E TA 


osu 2,30 
Fig. 7-4(a) Fig. 7-4(b) z 


Então, o número de estudantes que pesam mais do que 92,50 kg = 
= 500 (0,0107) 


Se W representa o pêso de um estudante escolhido 20 acaso, os resultados 
acima podem ser resumidos em têrmos de probabilidade, escrevendo-se: 


Prtsg, 


SW S77,75} = 0,6000 o Pri 292,75) = 0,0107. 


21T 
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21. Determinar quantos estudantes do problema anterior pesam: 
(a) menos do que 64 kg; (b) 64 kg; (0) 64 kg ou menos. 
Solução: 


(a) Os estudantes que pesem menos do que 64 kg devem pesar menos do que 


63,75 kg. 

63,75 kg om unidades reduzidas =(63,75 — 

— 75,50)/7,5 = — 1,57. 

Proporção desejada de estudantes = 

= (árca à esquerda de z= — 1,57) = E 7 

= (área à esquerda de z = 0) — (área en- -1,57 

tre z= — 157c2=0)=0,5 — 04418 = Fig. 1-5{a) 
. = 0,0582. 


O número de estudantes que pesam menos do que 64 kg = 500 (0,0582) = 29. 


(b) Os estudantes que pesam 64 kg têm pesos compreendidos entre 63,75 © 
64,25 kg. Veja a Fig. 7-5(b), abaixo. - 


63,75 kg em unidades reduzidas = (63,75 — 75,50)/7,5 = — 1,57. 
64,25 kg em unidades reduzidas = (64,25 — 75,50)/7,5 = — 1,50. 


Proporção desejada de estudantes = (área entre z as 1576 2= — 1,50), = 
= (área entre z = — 1,57 e z = 0y — (área entre z = —"1,500 2 = 0) = 0,4418 ~- 
— 0,4332 = 0,0086. ; 


Então, o número de estudantes que pesam 64 kg = 500 (0,0086) = 4. 


L 


mf 


-1,51 = 1,50 —1,50 


Fig. 7-50) Fig. Sto) 


see E 


(e) Os estudantes que pesam 64 kg ou menos devem ter pesos inferiores & 
64,25 kg. Veja a Fig. 7-5(0). 


64,25 kg em unidades reduzidas = (04,25 — 75,50)/7,5 = — 1,50. 

Proporção desejada de estudantes = (área à esquerda de z= — 1,80) = 
= (área à esquerda de z = 0) — (área entre z= — 1,5002 = 0) = 0,5 — 0,4332 = 
= 0,0668. 


562) = 


Então, o número de estudantes que pesam 64 kg ou menos = 500 (0,0663 
= 33. 
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Outro método: utilizando os resultados dos itens (a)-e (b). 
Número do esty 
pesam menos do” 


Antes. que pesam 64 kg ou menos = (número dos que 
4 kg) + (número dos que pesam 84 kg) =:20+4 = 33. 

22. Os graus de um questionário rápido de Biologia são O, 1, 
P AEE i L pontos, dependendo. do número de questões respondidas 
corretamente; emium total de 10. A média dos graus foi 6,7 e o 
desvio padrão 1,2, Admitindo-se que os graus são distribuídos nor- 
malmente, determinar: (a) a percentagem. de estudantes que obtive- 
ram 6 pontos; (b) o grau máximo dos 10% mais baixos da classe; 
(e) o grau mínimo dos 10% mais altos da classe. 


Solução: 


(a) Ao aplicar a distribuição normal 4 dados discretos, é necessário tratá- los 
como contínuos. Assina, um escore de 6 pontos é considerado como estando com- 
preendido entre 5,5 e 6,5. Veja a Fig. 7-4). 

5,5 em unidades reduzidas = (5,5 — 6,7)/1,2 = — 1,0. 

6,5 em tinidades reduzidas ='(6,5 — 8,7)/1,2 = — 0,17. 

Proporção. desejada = (área entre z= — 1 e z= — 0,17) = (área entre 
z= —1ez= 0) (área entre g = — 0,17 ez =0)= 0,3413 — 0,0675 = 
= 0,2738 = 27%. 


N a za 


Fig: 1-6(a) “Fig. 7-8(0) 


(b) Seja Xio grau máximo desejado e.z;o seu valor em unidades reduzidas. 


Na Fig. 7-8(b), a área à esquerda de zı é 10% = 0,10. Então, (área entre 


260) = 0,40 e zı = ~ 1,28 (com bos aproximação). 
Então, z1 = (Xi. 670/12 = — 1,28 e Xı = 5,2 ou 5, arredondando-se para 
inteiros. 


(c) Seja Xs o grau mínimo desejado e 2, o seu valor em unidades reduzidas. 
De acôrdo com (b), por simetria, 22 = 1,28. Então, (X3 — 6,712 = 1,28 e 
X = 82 ou 8, aredondando-se para inteiros. 


2%. A média dos diâmetros internos de uma amostra de 200 


arruelas produzidas por uma certa méquina é 0:502 polegadas e o 


desvio padrão €:0,005 polegadas. À finalidade para a qual essas 
arruelas são fabricadas permite a tolerância máxima, para'o diâmetro, 
de 0,496 à 9,508 Dolegadas; se isso não se verificar, as axruelas serão 
consideradas defeitnosas. Determinar a percentagem de arruelas de- 


femme tina 
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feituosas produzidas pela máquina, admitindo-se que os diâmetros 
são distribuídos normalraente. 
Solução: 


0,496 em unidades reduzidas = (0,496 — 0,502)/0,005 = — 1,2. 


Li 


0,508 em unidades reduzidas = (0,508 — 6,502)/0,005 


t 


L2 


Proporção de arruelas não-defeituo- 
sas = (área limitada pela curva 
normal entre z = — 1Zez= 1,2) = 

= (2 vêzes a área entre z = 0 e 
z = 1,2)=2(0,8849)= 0, 7698 ou 77%- 


Pig. 7-7 


Assim, a percentagem de arruelas defeituosas = 100% — 77% = 23%. 


Note-se que, se se imaginar que o intervalo entre 0,498 e 0,508 represento 
os diâmetros de 0,4955 a 0,5085 polegadas, o resultado acima será ligeiramente 
modificado. Para dois algarismos significativos, entretanto, os resultados são i iguais, 


Ajustamento de uma curva normal à distribuição binomial 


24. Determinar a probabilidade de se- obter de 3 a 6 caras, 
inclusive, em 10 lances de uma moeda. honesta, mediante a utiliza- 
ção: -(a) da distribuição binomial; (b) do ajustamento de uma curva 
normal à distribuição binomial, 


Solução: 


(a) Pra 3 caras) = 103 (à 1y (4 y= = 


14! 105 
Pr (4 caras) = 1004 +) (5 aa EIS 


Pr (5 caras) = 1006 G F (+ ) = e 
Pr {8 caras} = ls G y (4 y- m, 


5 PEE o C 4 105 
Então, Pr fentre 3 e 6 caras, inclusive) s ais + £ +r 32” 


99 
= ia 0,7734. 


| 
i 
i 
| 
t 
t 
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(b) A distribuição de probabilidade para ọ número de caras em 10 lances 
da moeda está indicada graficamente nas Figs, 7-%a) e 7-8Kb), abaixo, sendo que 


idade E ze - Probabilidade 


EA Cs 234 5 8 5.8 


Número de caras Número de caras 


“Fig. 7-8 (a) Fig. 7-8 (b) 


a Fig. 7-8(b) considera os dados como se fôssem contínuos. A probabilidade dese- 
jada éa soma das áreas dos retângulos sombreados da Fig. 7-8(b) e pode ser dada, 
aproximadamente, pela área subtendida pela curva normal correspondente, re- 
presentada em linha tracejada. 


Considerados os dados como contínuos, segue-se que 3 2 6 casos podem ser 
considerados como 2,5 a 6,5. Também, a média e a variância para & distribuição 
binomiah são dadas por p = Np = IWXB)=5e o = pe COXAS) = 1,58. 


5 — 5)/L,58 = — 1,58 e 6,5 em 


Isso pôsto, 2,5 em unidades reduzidas = 


. unidades reduzidas = (6,5 — 5)/1,58 = 095. = 


Probabilidade desejada = (área entro z = — 1,58 e z = 0,95) = (área entre > 


= — 1,58 c z = 0) + (área entro z = O è z = 0,95) = 0,4429 + 0,3289 = 
= 0,7718, que se aproxima bastante do valor verdadeiro, 0,7734, obtido no 
item (a). A precisão é sinda melhor para valores maiores de N, 


=1,58 Ta 
Fig. 7-9 


25. Uma moeda honesta é lançada 500 vêzes. Determinar. a 
probabilidade do número de caras não diferir de 250 de: (a) mais de 
10; (b) mais de 30. 


Solução: 


u= Np = (500X3) = 250 e o = Npg = VON) = 11,18. 
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(a) Deseja-se a probabilidade do número de cares ficar entre 240 e 260 ou, 
considerados os dados como contim:os, entre 239,5 e 260,5. 


239,5 em unidades reduzidas = (239,5 — 250)11,18 = — 0,94. 
260,5 em unidades reduzidas = 0,94. 


Probabilidade desejada = (área subtendida pela curva normal entre z = 
= — 0,94 e z = 0,94) = (duas vêzes à área entre z = 0 e z = 0,94) = 20,3264) = 


“= 0,6528. 


(b) Deseja-se 2 probabilidade do número de caras estar entre 220 e 280 ou, 
considerados os dados como contínuos, entre 219,5 e 280,5. 

219,5 em unidades reduzidas 219,5 — 2580/11,18 = — 2,73. 

280,5 em unidades reduzidas NEN 

Probabilidade desejada = (dues vêzes a área subtendida pela curva normal 
entre z=0e2=— 2,73) = 20, 4968) = 0,9936. 

Segue-se que se pode estar bem confiante de que o número de caras não 
diferirá do esperado (250) de mais de 30. Portanto, se acontecer que o número real 
de caras é 280, podemos acreditar, cora forte razão, que a moeda não é honesta, 
isto é, que está viciada. 


26. Um dado é lançado 120 vêzes. Determinar a probabilidade 
de aparecer a face 4: (a) 18 vêzes ou menos; (b) 14 vêzes ou me- 
nos, admitindo-se que o dado não é viciado. ` 


Solução: 


A face 4 tem a probabilidade de p= ="1/6 aparecer e a deg = “5/6 “de -nãorapa- e» 


recer. 
e 


(a) Deseja-se a probabilidade do número 4 ocorrer de O a 18 vêzes. Esta 6 
exatamente iguel a: 


mealy ME (> ye +C (1) E y” Past wola) (5) E 


mas, como o trabalho necessário para o cálculo é estafante, emprega-se O ajusta - 
menio normal. - 


Considerados os dados como contínuos, segue-se que o intervalo entre O e 
18 guatros pode ser considérado como compreendido entre -— 0,5 e 18,5. Também: 


a = No = 120 (1) = = 20e 0 = va = yom (4 D ($) =a 


Então, — 0,5 em unidades reduzidas = (— 0,5 — 20)/4,08 = — 5,02; 18,5 
em unidades reduzidas = — 0,37. 

Probabilidade desejada = (área subtendida pela curva normal entrez = — 
-— 502 e z = — 0,37) = (área entro z =0 e z= — 5,02) — (área entre z = 0 
e z = — 0,37) = 0,5 — 0,1443 = 0,3557. 
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(b) Procede-se como no item (a), substituindo-se 18 por 14. 
Então, — 05 em unidades reduzidas = — 5,07 "e 145 em unidades 


reduzidas = 21 20)/4,08 = — 1,35. ; 
Probabilidad -desejada = (área subtendida pela curva normal entre z = 
= — BOZO ~ 1,35) = (área entre z = 02 = — 5,02) — (área entre z = 0e 2 = 


= — 1,85) = 0,5 — 0,4115 = 0,0885. 


Segue-se que, tomando-se amostras sucessivas de 120 lances de um dado, 
o 4 apareceria 14 vêzes, ou menos, em cêrca de um décimo delas. 


A distribuição de Poisson 


27, Dez por cento das ferramentas produzidas por um certo 
processo de fabricação revelaram-se defeituosos. Determinar a pro- 
babilidade de, em uma amostra de 10 ferramentas escolhidas ao acaso, 
exatamente duas serem defeituosas, mediante o emprêgo: (a) da 
distribuição binomial; (b) da aproximação de Poisson para essa 
distribuição. 


Solução: 

Probabilidade de uma ferramenta ser defeituosa = p = 0,1. 
(a) Prí2 ferramentas defeituosas em 10) = 190x0,1)? (0,98 = 0,1937 ou 0,19 
(b). A = Np = 100,1) = 1. 

Ned Upe 


Pr {2 ferramentas defeituosas em 10} = FI q 


= 0,1839 ou 0,18, tomando-se e = 2,718. 
Em geral, a aproximação é boa quando p $ 0,1 e A = Np S 5, 


28. Se a probabilidade de um indivíduo sofrer uma reação 
nociva, resultante da injeção de um determinado sro, é 0,001, de- 
terminar a probabilidade de, entre 2 000 indivíduos: (a) exata- 
mente 8; . (b) mais do que 2, sofrerem aquela, reação. 


Solução: 
a PT E . AXA Kee 
Px indivíduos sofrerem uma reação nociva) = ~ E SF 
onde: À = Np = (2000/0,001) = 2. i 
3 g2 
(a) Pr {3 indivíduos sofrerem uma reação nociva) = TO = E = 0,180. 
E: 0 om2 ea ate 
(b), Pr tm suma sofrer) = Ee = 5 Pr {1 softer} = ae 
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Pr {mais do que 2 sofrerem} = 1 — Pr {0, 1 ou 2 sofrerem} = 


jpa (+ ył +) = 158 = 0,323. 
e e 


i 


3i 
Note-se que, de acôrdo com s distribuição binomial, a probabilidade desejada 
é dada por: 
997 
` (a) 200005 (0,001)? (0,999): °. : 
(b) 1— Fa o00Co (0,001)%0,999)? 00 + 2 ooo (0,001)! (0,999)? + 2 o00C2(0,001) 
(0,999)! 8}. 
“Seria muito difícil de calcular diretamente. 


29. Uma distribuição de Poisson é dada por p(X) = 


i (0,72) X e272 
= y a, 


Determinar: (a) p(0); ©) p0); © pl); (d) p3). 
Solução: 


0,72) 0072 (1) eta Shang tabel 
(a) p0) = LL a a 0,4868, usando a tabela 


do Apêndice VI. 


(o A) = Loga em = 0,72 602 = (0,72) (0,4868) = 0,3505. 


0,72} 0 (OBIBO À = 0,1262. 
O = terem gu 5 (0,2592) (0,4868) = ; 


Outro método: p(2) = SE ao = (0,36) (0,3505) = 0,1262. 


0,72) 272 _ 0,72 x Rd E 
(a) p83) = (i Ee = (2) = (0:24) (0,1262) = 0,0303. 


A distribuição polinomial 


30. Uma caixa contém 5 bolas vermelhas, 4 brancas e 3 azuis. 
Uma bola é escolhida ao acaso na caixa, sua côr é observada, e & 
bola é então recolocada.. Determinar a probabilidade de, entre 6 
bolas assim escolhidas, 3 serem vermelhas, 2 brancas e 1 azul. 


“Bolução: 


Pr (vermelha em qualquer retirada) = 5/12; 
Pr {brancs em qualquer retirada} = 4/12; 
Pr fazul em qualquer retirada) = 3/12. 
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Então, Pr {3 serem vermelhas, 2 brancas c 1 azul) = 
SEE (SS) (E) 
< 3121 Nag) N12 12/7 5184 
Ajustamento dos dados por meio de distribuições teóricas 


31. Ajustar uma distribuição binomial aos dados do Probl. 17, 
Capítulo 2, 


Solução: 


“Tem-se Pr [X caras em um lance de 5 moedas) = p(X) = sCy pH X, em que 
pc q são, respectivamente, es probabilidades de surgir uma cara ou uma coroa 
em um só lance de uma moeda, De acôrdo com o Probl. 11(a), o número médio 
de caras é p = Np = 5p. 

Para a distribuição de fregiiência observada ou real, o número médio de 
curas 6: 


ZIX O (380) + (144) (1) + G42)(2) + (287) (2) + (164) (4) + (25) (5) 
Èj j 1000 
MEZIO 
1000 


2,47. 


Igualando a média teórica à real, 5p = 2,47 ou p = 0,494. Por isso, a dis- 
“tribuição binomial ajustada é dada por: 
AX) = sCx (0,494)¥ (0,506) X. 
Na Tabela 7.4, essas probabilidades foram relacionadas, hem como as fre- 
qüências real e esperada (teórica). O ajustamento é tido como apropriado.. À 
aderência do ajustamento é investigada no Probl. 12 do Capítulo 12, 


Tabela 7.4 

N.º de qo Fregiiência | Fregiência 
caras; X Prix caras) esperada observada 

0 0,0332 33,2 ou 33 | 38 

} 0,1619 161,9 ou 562 144 

2 0,3162 316,2 ou 315 342 

3 0,3087 308,7 ou 309 287 

4 0,1507 150,7 ou 151 164 

0,0294 29,4 ou 29 25 


e 


32. Usar o papel para gráficode probabilidade para determinar 
se a distribuição de frequência da Tabela 2.1, da pág. 43, pode ajus- 
tar-se a uma distribuição normal. 
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Tabela 7.5 
Fregiiência | 

Altura acumulada 
(centimetros) relativa (%) 
Abaixo de 154,5 5,0 
Ab: de 162,5. 230 
Abaixo de 170,5 65.0 
Abaixo de 178,5 92,0 
Abaixo de 186,5 100,0 


Primeiramente, converte-se a distribuição de frequência dade em uma rela- 
tiva acumulada, como mostra a Tabela 7.5. Depois, as frequências relativos 
acumuladas, expressas em porcentagens, são locadas em relação aos limites reais 
da classe superior, no papel especial de probabilidade, como está representado. 

i] 


99, m m r 
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o = 
154,5 162,5 170,5 178,5 186,5 


Altura (er) 


Fig. 7-10 


na Fig. 7-10. A maneira, segundo a qual todos os pontos se dispõem sôbre uma reta, 
determina quão perfeita é » adaptação da distribuição dada à normal. Do acima 
exposto, vê-se que há uma distribuição normal que se adapte aos dados com 
bastante aproximação. j 


33. Ajustar uma curva normal aos dados da Tabela 2.1, pág. 43. 
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Solução: 
Tabela 7.6 ` i 
$ A Fre- 
: Área subten- | P, 
Alturas | Limitesdo | f PATA OS | dida pela cur- | Área de | Freqüência | 44n 
(centimetros) | classe, aa va normal en- | cada classe) esperada e 
tredez : obser- 
vada 
L 
151a 158] 1505 4,13 0u 4 5 
159 « 166 yee 20,68 ou 21 | 18 
167 a 174 eo 38,92 ou 39 | 42 
175 a 182 eo 27,71 ou 28 | 27 
183 a 190 A TAS ou 7 8 


X = 171,70 em, s = 7,78 em 


f O trabalho pode ser organizado como na Tabela 7.6. Ao calcular z para os 
limites reais de classe, usa-se 2 = (X — X)/s, tendo sido a média Xe desvio 
padrão s obtidos, respectivamente, no Probl.. 22 Capítulo 3 e no Probl. 17, 
Capítulo 4, ` 


` Na quarta coluna, as áreas subtendidas pela curva normal de O a z foram 


` obtidas mediante o emprégo da tabela do Apêndice II. Delas são deduzidas 


as áreas subtendidas pela curva normal, entre dois valores sucessivos de z, 
apresentadas na quinta coluna. Foram obtidas, mediante a subtração das áreas 
sucessivas da quarta coluna, quando os z correspondentes têm o mesmo sinal e, 
sua soma, quando os sinais são contrários (o que ocorre apenas uma vez na tabela). 
A razão disso torna-se imediatamente clara por meio de um diagrama. 


Multiplicando-sé as casas da quinta coluna (que representam as fregiiências 
relativas) pela fregiiência total N (neste caso N = 100) obtém-se as fregiiências 
esperadas, relacionadas na sexta coluna. Vê-se que clas concordam com as fre- 
quências reais ou observadas, constantes da última coluna, 

Se fôr desejado; pode-se adotar o desvio padrão corrigido, mediante o emprêgo 
da correção de Sheppard (veja o Probl. 21(«), Capítulo 4). 


A “aderência do ajustamento” da distribuição será considerada no Probl. 13, > 


Capítulo 12. 


34, A Tabela 7.7 mostra o número.de dias f, de um período 
de 50, no qual ocorreram X acidentes de automóvel em uma cidade. 
Ajustar uma distribuição de Poisson para êsses dados. 


Solução: 


O número médio de acidentes é: A 
À = BE EOE LOO ETOO HD HA 
E. . 50 
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Tabela 7.7 


d N.º de Acidentes, X| N.º de Dias, f 


21 
18 
7 
3 
1 


BONO 


Total 50 


Então, de acôrdo com a distribuição de Poisson: 
90)X rogo 
Pr {X acidentes} = (0,00 em, 
p : x! 

Na Tabela 7.8 estão relacionadas as probabilidades para 0, 1,2, 3 e 4 aciden- 
tes, deduzidas dessa distribuição de Poisson, bem como os números teóricos ou es- 
perados de dias durante os quais ocorrem X acidentes (obtidos mediante a multi- 
plicação das respectivas probabilidades por 50). Por conveniência da comparação, 
repetiram-se na quinta coluna os números reais de dias, 


Tabela 7.8 
N.º de Acidentes, X | Pr [X acidentes) | N.º Esperado de Dias Ne E de 
0 0,4066 20,33 óu 20 2r 
$ 0,3659 18,30 ou 18 18 
2 0,1647 8,24 ou 8 a 
3 0,0494 2,47 ou 2 3 
4 0,0111 0,56 ou 1 1 


Note-se que a adaptação da distribuição de Poisson aos dados fornecidos é boa. 

Para uma distribuição de Poisson verdadeira, a variância é 0?=A.'Q cálculo 
da variância, para a distribuição dada, deu 0,97. Esse valor é favoravelmente 
comparável com o de 0,90, e êsse fato: pode ser considerado como uma evidência 
adicional da conveniência da distribuição de Poisson para o ajustamento de dados 
amostrais. i 


Problemas Suplementares 
A distribuição binomial 

35. Caleular: (a) 71; (b) 1016141); (0) 9Cs; (d) uC; (e) 601. 

Resp." (a) 5 040; (b) 210; (e) 126; (d) 165; (è) 6. 

Z6. Desenvolver: (a) (g + pY; ©) (q + p)”. 3 i 

Resp.: (a) d + Tgp + 21gp + 35q'p + 3gp + AP + Tap? de pl; 
(b) q + 109%p + 4598p? -+ 1209p? + 2109%p! + 2520p +2109!pº + 
+ 1200p" + 450p? + 10yp? + p". 
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37. Determinar a probabilidade de, so lançar uma moeda honesta 6 vêzes, 
aparecerem: (a) O; (b) 1; (c) 2; (d) 3; (e) 4; (4) 5; (9) 6 caras. 


Resp.: (a) 1/64; (b) 3/32; (c) 15/64; (2) 5/16; (e) 15/64; (J) 3/32; (9) L64- 

38. Determinar a probabilidade de: (4) 2 ou mais caras; (b) menós que 4 caras, 
em uma jogada única do 6 moedas honestas. 

Resp.: (a) 57/64; (b) 21/32. 

39, Se X representa o número de caras em uma jo 
honesta, determinar: (4) Pri X = 3);(b) Pri X <2}; le) Pr 

Resp.: (a) 1/4; (b) 5/16; (c) 11/16; (d) 5/8. 


ica de uma moeda 
d) Pr[1<X £3}. 


Al De. E z 

40. Entre 800 famílias com 5 crianças cada uma, quantas se esperaria que 
ti a . inos: tT H 4 
tivessem: (a) 3 meninos; (b) 5 meninas; (c) 2 ou 3 meninos. Considerar probabili- 
dades iguais para meninos e meninas. 


Resp.: (a) 250; (b) 25; (c) 500. 


41, Determinar a probabilidade de, em dois lances de um par de dados 
honestos, obter-se um total de 11 pontos: («) uma vez; (b) duas vêzes. 


Resp.: (a) 17/162; (b) 1/324. 


B. Qual é a probabilidade de- obter-se um 9 exatamente uma vez, em 3 arre- 
messos de um par de dados? 


Resp.: 64/243. 


43, Determinar a probabilidade de adivinhar-se corretamente pelo menos 
6 das 10 respostas de um questionário do tipo “corto-errado”, 


Resp.: 193/512. 


44, Um vendedor de seguros vende apólices a 5 homens, todos da mesma 
idade e de boa saúde. De acôrdo com as tabelas atuariais, a probabilidade de um 
homem, dessa idade particular, estar vivo daqui a 30 anos é de 2/3. Determinar 
a probabilidade de estarem ainda, vivos daqui a 30 anos: (4) todos os 5 homens; 
(b) pelo menos 3; (c) apenas 2; (d) pelo menos 1 homem. f 

Resp.: (a) 32/243; (b) 192243; (6) 40/243; (d) 242/2 


3. 

45, Culoul 
média; (b) o & 
ficionte do mome 


binomial, com p = 0,7 e N = 80: (a) a 
« do momento de assimetria; (d) o coe- 
os resultados. 


de 


Resp.: (a) 42; (h 


46. 1 
seu coefie 


WNSÉPRE p ma distr 


nie de z o du curtose é 


47. Culeutar: (4) 
binomial, 


Resp.: (a) Npa — r) (by Np — Gpe) + 2N? 


48. Demons 


3 6) MAX — BN), para a distribuição 


Pr. 


entes de momontos 


Jas da pág. 200 para os cocoi 


de a 
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A distribuição normal 


- 49. Em um exame de estatística, a média foi 78 e o desvio padrão 10. (a) 
Determinar os escores 'reduzidos de 2 estudantes cujos-graus foram.93 e 62, res- 
pectivamente. (b) Determinar os graus de 2 estudantes cujos escores reduzidos 
foram, respectivamente, — 0,0 e 1,2. 

Resp.: (a) 1,5, — 1,6; (b) 72, 90. 


50. Determinar: (a) 2 média; (b) o desvio padrão de um exame, à cujos graus 
70 e 88 correspondem, respectivamente, os estores reduzidos — 0,6 ¢ 1d. 


Resp.: (a) 75,4; (b) 9. 


51. Determinar a área subtendida pela curva normal entre: (a) z == 1,20 è 
z = 2,40; (b) 2 = 1,23 e 2 = 1,87; ()r=—235e2=— 0,50. 
Resp.: (a) 0,8767; (b) 0,0786; (c) 0,2991. 


52. Determinar a área subtendida pelz curva normal; w à esquerda de 
= — 1,78; (b) à esquerda de z = 0,56; (c)à direita de z = — 1,45; (d) corres- 

oordénie az È 2,16: (e) correspondente a — 0,80 S z 5 1,53; (J) à esquerda de 
2 = — 2,52 e à direita de z = 1,83. 

Resp.: (a) 0,0375; (b) 0,7123; (c) 0,9265; (d). 0,0154; (e) 0,7251; (7) 0,0395. 

53. Se z é normalmente distribuída, com média Q e variância 1, determinar: 
(a) Priz 2 — 1,64); (è) Pri — 1,90 Sz $ 1,96); (0) Prllz | 2 1), 

Resp.: (a) 0,9495; (b) 0,9500; (c) 0,6826. 

54. Determinar o valor de z para que: (a) a'área à direita de z seja 0,2266; 
(b) a área à esquêrda de z seja 0,0314; (c) a área entrei 0,23 e 2 seja 0,5722;- 
(d) à área entre 1,15 e z seja 0,0730; (o) a área entre — z e z seja 0,9000. ` 

Resp.: (a) 0,75; (b) — 1,86; (c) 2,08; (d) 1,625 ou 0,849; (e) «+ 1,645. 


55. Determinar zı na expressão Priz = 2) = 0,84, em que z é normalmente 
distribuída, com média O e variância 1. 

Resp.: — 0,995. 

56. Determinar as ordenadas da curva normal para: (a) z = 2,25; (b) z = — 
— 0,32; (c) z = — 1,18. 

Resp.: (a) 0,0317; (b) 0,3790; (c) 0,1989. 


57. Sc as alturas de 300 estudantes são normalmente distribuídas, 
172,72 em e desvio padrão 7,62 cm, quantos estudantes têm alturas: (2) superiores 
a 182,88 cm; (b) iguais a 162,56 ou menores; (c) entre 165,10 cm e 180,34 em 
inclusive; (d) iguais a 172,72 cm? Admitir que as medidas foram registradas até 
centímetros, 


Resp.: (a) 20; (b) 36; (c) 227; (d) 40. > 


38. Se os diâmetros de rolamen 
com média 0,6140 polegadas e desvio pad jo 00 
percentagens dos que têm diâmeiros: (a) entre 0,610 e 0, 
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(b) superiores a 0,617 polegadas; (e) menores do que 0,608 polegadas; (d) iguais 
a 0,615 polegadas. 


tm) 93%; (b) 81%; (0) 0,47%; (d) 15%. 
59. O grati médio do um exame final foi 72 e o desvio padrão 9. 10% dos 


melhores estudantes receberam a classificação 4. Qual o grau mínimo que um 
estudante deye obter para classificar-se em A? 


Resp.: 84.. e 


r 7 Resp.: 


60. Se um.conjunto de medidas é normalmente distribuído, qual a percen- 
tagem das que diferem da média de: (a) mais da metade do desvio padrão; (b) menos 
de 3/4 do desvio padrão ? 

Resp.: (a) 61,7%; (b) 54,7%. 


61. Se Xé a média e s o desvio padrão de um conjunto de medidas normal- 
mente distribuídas, que percentagens delas estão: (a) dentro do intervalo (X + 2s); 
(b) fora do intervalo (X + 1,25); (e) superiores a (X — 1,55)? 

Resp.: (a) 95,4%; (b) 23,0%; (c) 93,3%. 


62. No problema precedente, determinar a constante a de modo que a per- 


(X — as) seja 22%. . É 
Resp.: (a) 1,15; (b) 0,77. 


Ajustamento de uma curva normal à distribuição binomial 


63. Determinar a probabilidade de, em 200 lances de uma moeda, resulta- 
rem: (a) entre 80 e 120 caras, inclusive; (b) menos de 90 caras; (c) menos de 85 
ou mais de 115 caras; (d) exatamente 100 caras. É 

Resp.: (a) 0,9962; (b) 0,0687; (c) 0,0286; (d) 0,0558. 


64, Determinar a probabilidade de um estudante poder acertar corretamente, 
entre as perguntas de um questionário do tipo “certo-errado”: (a) 12 ou mais entre 
20; (b) 24 ou mais entre 40 questões. 

Resp: (a) 0,2511; (b) 0,1342. 


65. Uma máquina produz parafusos, dos quais 10% são defeituosos. Deter- 
minar a probabilidade de, em uma amostra tomada ao acaso de 400 parafusos pro- 
duzidos por essa máquina, serem defeituosos: (a) no máximo 30; (b) entre 30 e 50; 
(c) entre 35 e 45; (d) 55 ou mais. É 

Resp.: (a) 0,0567; (b) 0,9198;, (0) 0,6404; (d) 0,0079. 

66., Determinar a probabilidade de obter-se mais de 25 “setes” em 100 lances 
de um par dé dados honestos. 

Resp. 0,0082. 


Poisson 


lâmpadas elétricas fabricadas por uma companhia são defei- 
tuosas, determinar a probabilidade de, em uma amostra de 100 lâmpadas, serem 
defeituosas: (a) Q; (b) 1; (c) 2; (d) 3; (e) 4; (f) 5 lâmpadas. 

Resp.: (a) 0,04979; (b) 0.1494; (e) 0,2241; (d) 0,2241; (e) 0,1680; (f) 0,1008. 


ENE Fo pintas 


centagem dos casos: (a) dentro do intervalo (X + as) seja 75%; (b) inferiores a. 


mig! sos dados segu! 


| do Brobi. 59, 


car. T 


68. No problem: 
(a) mais de 5; (b) en 
Resp. (a) 0,0838; (b) 0,5978; (c) 0,4 


232 , é 


69, Ume sacola conté: . bola de gude vermelha e sete brancas. Retira-se 
uma da sacola e observa-se sua còr. Depois, a bola é restituida à sacola e o conteúdo 
é completamente misturado. Determiner & probabilidade de, em 8 retiradas, 
ser selecionsda uma bola vermelha exatamente 3 vêzes, mediante o emprêgo de: 
(a) uma distribuição binom 1; (b) um ajustamento de Poisson & essa distribuição. 

Resp.: (a) 0,05610; (b) 0,08131. 


70. De acôrdo com o “National Office of Vital Statistics of the U.S. 
Department of Health, Education and Welfare”, o número médio de acidentes 
ocorridos por ano, nos Estados Unidos, é de 3;0 por 100 000 pessoas. Dei minar 
a probabilidade de, em uma cidade de 200 000 habitantes, haver: (a) 0; (b) 2; (e) 6; 
(d) 8; (e) entre 4 e 8; U) “menos de 3 acidentes por ano, 

Resp.: (a) 0,00248; (b) 0,04462; (c) 0,1607; (d) 0,1033; (e) 0,6964; (7) 0,0620. 


7}. Entre as 14e 16 horas, o múmero médio de chamados telefônicas por 
minuto, estendidas pela mesa de ligações de uma companhia, é 2,50. Determinar 
a probabilidade de, dursate um determinsido minuto, haver: (a) 0; (b) 1; (6) 2; (d) 3; 
(e) 4 ou menos; (/) mais de 6 chamadas telefônicas. 

Resp.: (a) 0,08208; (b) 0,2052; (o) 0,2565; (d) 0,2138; (e) 0,8914; (J) 0,0142. 


A distribuição po! 


73. Um dedo honesto é lançado 6 vêzes. Determinar a probabilidade de 
aparecerem: (a) 1 “um”, 2 “dois” e 3 “hrêo”’; (b) sômente uma vez cada face. 
Resp.: (a) 5/3888; (b) 5/324. à 


43. Uma urna contém grande número de bolas de gude vermelhas, brancas, 
azuis e amarelas na proporção 4:3:2:1, respectivamente. Determinar 2 pro- 
babilidade de, em 10 extrações, serem extraídas: (a) 4 vermelhas, 3 brancas, 2 azuis 
e 1 amarela; (b) 8 vermelhas e 2 amarelas. . 

Resp.: (0) 0,0003248; (b) 0,000295. 


74. Determi 


a probabilidade de não se obter 1, 2 ou 3, em quatro lances 


de um dado honesto 
Resp.: 3/8. 


do dados p 


75. Ajustar w 


a distribuição bino- 


Bap: (Kml y (03 


r 3e os dados 
normash, 


76. Uss 
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77. Ajustar uma distribuição normal aos dados do Probl. 59, Capítulo 3. 

Resp.: As fregiiências esperadas são: 1,7; 5,5; 12,0; 15,9; 13,7; 7,6; 27 e 0,6, 
respectivamente. ero lg A 

78, Ajustar uma- distribuição normal aos dados do Probl. 61; Capítulo 3, 

Resp.: As frequências esperadas são: 1,1; 4,0; 11,1; 23,9; 39,5; 50,2; 49,0; 36, 6; 
23,1; 94; 3,1 e 1,0, respectivamente. 


79. Ajustar uma distribuição de Poisson 20s dados do Probl, 75 e compará-l la 
com o ajustamento obtido por meio da distribuição binomial. 


Resp.: As fregtiências esperadas são: 41,7; 53,4; 34,2; 14,6 e 4,7, respecti- 


vamente. 


80. Em 10 unidades do exército 
prussiano, num período de 20 anos, x o 4 2 3 4 
1875-1894, o número de mortos por 
unidade e por ano, resultante de 
coicos de cavalo, está relacionado na 
seguinte tabela. Ajustar uma distri- 
buição de Poisson a êsses dados. 


X 0,61 
Resp.: p(X) = osure . ` As freqüêĉncias esperadas são: 108,7; 66,3; 


20,2; 4,1 e 0,7, respectivamente. 


CaríruLo 8 


TEORIA ELEMENTAR DA AMOSTRAGEM 


Teoria da amostragem 


A teoria da amostragem é um estudo das relações existentes entre 
uma população e as amostras dela extraídas. É de grande valor em 
muitas conjeturas. Por exemplo, é útil para a avaliação de. grandezas 
desconhecidas da população (como sua média, sua variância etc), 
frequentemente denominadas parâmeiros populacionais ou, abreviada» 


mente, parâmetros, attavés de conhecimento das grandezas conmespon 


dentes das amostras (como a média da amostra, sua "variância etc), 
muitas vêzes denominadas estatísticas amostrais ou, abreviadamente, 
estatísticas. Os problemas de avaliação serão tratados no Capítulo 9. 


A teoria da amostragem é também útil para determinar se as 
diferenças observadas entre duas amostras são realmente devidas a 


uma variação casual ou se são verdadeiramente significativas. Essas. 


questões surgem, por exemplo, a0 ensaiar-se um nôvo sôro para ser 
empregado no tratamento de uma doença, ou ao decidir-se se um 
processo de produção é melhor do que outro. As respostas a essas 
questões implicam no uso dos denominados testes de significância e 
hipóteses, que são importantes na teoria das decisões. files serão con- 
siderados no Capítulo 10. 


Em geral, um estudo de inferências, feito a respeito de uma po- 
pulação, mediante a utilização de amostras dela extraídas, juntamente 
com as indicações da precisão dessas inferências, obtidas por meio 
da teoria da probabilidade, é denominada inferência estatística. 
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Amostras aleatórias, números aleatórios 


“A fimde que as conclusões da teoria da amostragem e da infe- 
“rência estatistica sejam válidas, as amostras devem ser escolhidas de 
modo a serem representativas de uma população. O estudo dos méto- 
dos da amostragem e dos problemas correlatos: que surgem, é deno- 
minado planejamento de. experiência. . 

Uma das maneiras segundo as quais se pode obter uma amostra 
“representativa, é o processo denominado amostragem aleatória, de 
acôrdo com o qual cada elemento de uma população tem a mesma 
probabilidade de ser incluído na amostra. Uma técnica para a obtenção 
de uma amostra aleatória consiste em atribuir um número a cada 
elemento da população, escrever êsses números em pedacinhos de 
papel, colocá-los em uma urma €, depois, extraí-los dali, depois de 
misturá-los cuidadosamente, antes de cada extração. Pode-se subs- 
tituir êsse processo pelo emprêgo de uma tabela de números aleatórios 
(veja o Apêndice VIT), especialmente construída para essa fing- 
lidade (veja o Probl. 6). A 


Amostras com e sem reposição 


Se um número é extraído de uma urna, deve-se decidir se êle 
será ou não reposto na mesma antes de uma, segunda extração. . No 
primeiro caso, o número pode ocorrer várias vêzes, enquanto que, 


no segundo, êle só pode aparecer uma vez. À amostra em que cada, 


elemento de uma população pode ser escolhido mais de uma vez é 
denominada amostra com reposição, enquanto que, se cada elemento 
hão pode ser escolhido mais de uma vez, é denominada amostra sem 
reposição. f 

As populações podem ser finitas ou infinitas. Se, por exemplo 
extraem-se sucessivamente 10 bolas, sem reposição, de uma urna que 
contém 100, está se tomando a amostragem de uma população finita, 
enquanto que, se se lança uma moeda 50 vêzes e se conta o total de 
esras, está se considerando a amostra de uma população infinita. 


Uma população finita, cuja amostragem é feita com reposição, 
pode ser considerada tedricamente, como infinita, visto que qualquer 
número de amostras pode ser extraído sem exaurir é população. Para 
fins práticos, a amostragem de uma população finita muito grande 
pode ser considerada. como a de uma população infinita. 
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Distribuições amostrais 

Considerem-se tôdas as amostras possíveis de tamanho N que 
podem ser retiradas de uma população dada (com ou sem reposição). 
Para cada amostra pode-se calcular uma grandeza estatística, como 
a média, o desvio padrão etc., que varia de amostra para amostra. 
Dêsse modo, obtém-se uma distribuição da grandeza que é denominada: 
distribuição amostral, Se, por exemplo, a grandeza estatística parti- 
cular adotada fôr a média da amostra, a distribuição é denominada, 
amostral das médias, ou da média. Semelhantemente, poder-se-ia ter 
distribuições amostrais do desvio padrão, da variância, da média, 
das proporções etc. 

Para cada distribuição amostral pode-se calcular a média, o 
desvio padrão ete.: Em conseqiiência, pode-se falar da média e do 
desvio padrão da distribuição amostral das médias ete. 


Distribuição amostral das médias 


Admita-se que tôdas as amostras possíveis de tamanho N são 
retiradas, sem reposição, de uma população finita de tamanho 
No>N. Se a média e o desvio padrão da distribuição amostral das 
médias foram designados por uxe ox, e os valores correspondentes 
da população o forem por 4 e o, respectivamente, então: 


E = 


Se a população fôr infinita, ou se a amostragem fôr tomada com 


reposição, os resultados acima reduzir-se-ão a: 


ia 
VN 

Para grandes valores de N (N 230), a distribuição amostral 
das médias é aproximadamente normal, com a média uz e o desvio 
padrão ox, independentemente da população (enquanto 2 variância 
e a média da população forem finitas e o tamanho desta fôr, no mini- 
mo, o dôbro do da amostra). Êsse resultado, para uma população in- 
finita, é um caso especial do teorema do limite central da teoria avan- 
çada da probabilidade, que mostra que a precisão da aproximação 
melhora quando N cresce. Isso é indicado, algumas vêzes, dizendo-se 
que a distribuição amostral é assintdticamente normal. 


uE=u e = 


(2). 
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No caso da população ser normalmente distribuída, a distribuição 
amostral das médias também o será, mesmo para pequenos valores 
de N listo'é, N < 30): 


Distribuição amostral das proporções 


Admita-se que uma população é infinita e que a probabilidade 
da ocorrência de um evento (denominado seu sucesso) é p, enquanto 
que a de sua não-ocorrência é q = 1 — p. Por exemplo, a população 
pode ser constituída de todos os lances possíveis de uma moeda honesta, 
sendo p = 1/2 à probabilidade do evento “cara”. 

Gonsiderem-se tôdas as amostras possíveis de tamanho N ex- 
traídas de uma população e, para cada amostra, determinemos à 
proporção P de sucessos. No caso da moeda, P seria a proporção 
de caras que aparecessem em N lances. Então, obtém-se uma dis- 
tribuição amostral das proporções, cuja média, up, e desvio padrão, 
Gp, são dados por: 

-2 qa, (2) 
N N 
que se pode deduzir de (2), fazendo m.= p.e © = pq. 

Para grandes valores de-N (N = 30), a distribuição amostral é, 
muito aproximadamente, normal. Note-se que a população é dis- 
tributda binomialmente. ` 

As Egs. (3) são também válidas para uma população finita, 
cuja, amostragem “seja tomada com reposição. 


prp e Op es 


Para populações finitas, cuja amostragem é obtida, sem reposição, 
as Eqs. (3) são substituídas pelas Eqs. (1) com u =p e ¢ = pq. Pq. 

Note-se que as Egs. (3) são obtidas mais facilmente, divi- 
dindo-se por N a média e o desvio padrão (Np e Npa) da distri- 
buição binomial (veja o Capítulo 7). 


Distribuição amostral das diferenças e somas 


Admita-se que são dadas duas populações. Para cada amostra, 
de tamanho Ni, retirada da primeira população, calculá-se uma gran- 
deza estatística S: Isso produz uma distribuição amostral dessa 
grandeza estatística Si, cuja média e desvio padrão são representados 
por ks € Gs, respectivamente. Semelhantemente, para cada 


a 
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amostra de tamanho Ns, retirada da segunda população, calcula-se | 


uma grandeza estatístico S: Obtém-se uma distribuição amostral 
dessa grandeza So, cuja média e desvio padrão são representados 
por Hss © “sy De tôdas as combinações possíveis dessas amostras 
das duas populações, pode-se obter uma, distribuição das diferenças 
“Sa — So, denominada distribuição amostral das diferenças das esta- 
tásticas. A média e o desvio padrão dessa distribuição amostral, 
representados, respectivamente, por us, sy € Os; - sy são dados 
por: 


= f 2 à 
Hsi - Sp = Hs, is O Ogg = d+ T52 (4) 


desde que as amostras escolhidas não dependam de modo algum uma 
da outra, isto é, que elas sejam independentes, 


Se 91 e 8, são as médias das amostras das duas populações, repre- 


. sentadas por X, e X, então a distribuição amostral das diferenças 


das médias, para populações infinitas, com as médias e os desvios 
padrões Hı, 01 € Ma, 93 respectivamente, é dada por: 


HZ- i = Mo HR SHoh e Zr- F = 


TE - 


Gê cg i ; 
= fa g, “ T 
1 2 


mediante o emprêgo das Eqs. (2). O resultado vale, também, 
para populações finitas, se a amostragem foi tomada com reposição. 
Podem ser obtidos resultados semelhantes para populações finitas, 
cuja amostragem fôr feita sem reposição, mediante o emprêgo das 
equações (1). 


Resultados correspondentes podem ser obtidos para as distri- 
buições amostrais das diferenças de proporções de duas populações 
distribuídas binomialmente, com os parâmetros pı , qt © Pa qe res- 
pectivamente. Nesse caso, 8, e S, correspondem “às proporções dos 
sucessos, P1 € Pa, e as equações (1) produzem os resultados: 


HPI- = Hp, HP = Pi Ps e cn-m= Y, to, = 


Pigi Pago 
8 
E pA Ri (6), 


Fá 
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Se Nie No são grandes (Mie No 2 30), as distribuições amos- 
trais das diferenças das médias ou das proporções têm, muito apro- 
ximadamente, distribuição normal. ; a 


É conveniente, muitas vêzes, falar-se da distribuição amostral da 
soma de estatísticas. A média e o desvio padrão dessa distribuição 
são dados por: : E 


Hsi tifo = Es Thus € Units 
admitidas as amostras como independentes, 


Erros padrões 


O desvio padrão da distribuição amostral de uma grandeza es- 
tatística é frequentemente denominado seu êrro padrão. Na Tabela 8.1 
estão relacionados os erros padrões de distribuições amostrais, para 
várias grandezas estatísticas, sob as condições de amostragem 
aleatória de ums população infinita (ou muito grande) ou de amos- 
tragem com reposição de uma população finita. Também estão rela- 
cionadas observações especiais, que indicam as condições, sob as quais 
os resultados são válidos, e outras informações pertinentes. 


As quantidades 4, 0, P, re X, s, P, m, representam, respecti- 
vamente, as médias, os desvios padrões, as proporções e os momentos 
de ordem r, centrados na média, para a população e para a amostra. 

Note-se que, se o tamanho da amostra N fòr suficientemente 
grande, as distribuições amostrais serão normais ou aproximadamente 
normais. Por esta razão, os métodos são conhecidos como métodos 
das grandes amostras. Quando N < 30, as amostras são denominadas, 
pequenas.. A teoria das pequenas amostras, ou das amostras exaias, 
como algumas .vêzes é denominada, será tratada, no Capítulo 11. 


` Quando os parâmetros populacionais, como 9, p OU fr são des- 
conhecidos, ê es podem ser aproximadamente avaliados por meio 
das grandezas estatísticas correspondentes da amostra, a saber, s for 
3 = YNN = 4) 3l, Pe mpy se estas forem suficientemente grandes. 


ay 


p 


Tabela 81- 


rros Padrões para Algumas Dist: 


Êrro Padrão 


Observações Especiais 


Essa, expressão é válida para grandes © 
pequenas amostras. A distribuição amostral 
das médias é muito aproximadamente nor- 
mal para W = 30, mesmo quando a popu- 
lação não é normal. Vy = 4, média popula» 
cional em todos os casos. ab ad val 


Proporções 


Às observações feitas para as médias spli- 
coxa-so também a êste caso. up = p om ! 
todos 08 CASOS. mamar E 


H (1) vs = 
Desvios Padrão 
(2) cs = 
CEREM EAN per 


Medianas 


Primeiro e Terceiro 


Quartis 


N: 


1,36260 
E 


ODj = ODo = iam 


DE EE N = 100, Ms = 0, aproximadamente. 


[Para N = 00, a distribuição ámostral de 
s é muito aproximada da normal. 


g, é dado por (1), sômente quando a popu 
lação fôr normal (ou aproximadamente nor~ 
mai). Sə isso não ocorrer, pode ser useda a 
expressão (2). Note-se que (2) se transforma 
em (1), quando xa = G?e My = 304.9 que é 
verdadeiro para populações normais. Para 


Para N = 30, a distribuição amostra! da 
mediana é muito aproximado da normal. 
O resultado obtido sómente é válido quan- 
do a população é normal (ou aproximado: 
mente normal). 

Hed Et mma mera eee 
As observações feitas para as medianas 
aplicam-se também a êste caso. a 
HQI 4 HQs são, aproximadamente, iguais ao 
primeiro e ao terceiro quartis da população. 
| Note-se que gQ= Smed. ; 


As observações feitas para as medianas 
aplicam-se também a êste caso. 

EDI HD2... São, aproximadamente, iguais 
20 primeiro, segundo... decis da popula- 
ção. 


Note-se que SD, = Cmad, 


OD: = Da = 
SD = EDT = 
GD = CDe = 
Amplitude Semi- . 
-“interquertílica. fg = ALKA 
VN 


gões feitas para as: medianas 
aplicara-se também a êste caso. 

Eq $, aproximadamente, igual à amplitude 
semi-intorquartílica da população. 


Veriâncias 


Coeficiente de 
Variação + 


E O 


E As observações feitas para o desvio padrão 


aplicar-se também a éste caso. 


te caso, v = oju é o coeficiente de va 
ão da população. O resultado obtido 
vale para populações normais (ou aproxi- 
medemente normais) e para N & 100. 
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Problemas Resolvidos 


Distribuição amostral das médias 


1. Uma população consiste de cinco números: 2, 3,6, 8/11. Con- 


siderem-se tôdas as amostras possíveis de 2 elementos que dela podem 
ser retiradas, com reposição. Determinar: (a) a média da população; 
(b) o desvio padrão da população; (c) a média da distribuição amostral 
das médias; (4) o.desvio padrão da distribuição amostral das médias, 
isto 6, o êrro padrão das médias. 


solução: 
(a) p = ELSLOHSAU (30 go, 
5 5 j 
(O) da eE O O C CLO 
5 


= 164940 44425 
5 
(c) H4 5(5) = 25 amostras de dois elementos, que podem ser retiradas com 
reposição (visto que qualquer um dos cinco números da primeira extração pode 
ger associado a qualquer um dos cinco da segunda). Elas são: 
(2,2) (2,3) (2,6) (2,8) (2,11) 
(32) (33) (36) (3,89 (311) 
(62). (6,3) (6,6) (6,8) (6,11) 
(82) (83) (86) (88) (8,11) 
“AL BT (1453) (11,6) (IB) (IL, 11). 
As médias das amostras correspondentes são: 


=10,8 e q = 3,29. 


200 25 40 500 85 

25 30 45 55 7,0 

a) 40º 45 60 70 85 
50 55 70 80 9,5 


45 7,0 8,5 9,5 11,0 


e a média də distribuição amostral das médias é: 


das amostras do item (1), acima _ 150 
Wa 25 T 
o que exemplifica o fato de ser p F = p. 


6,0,” 


(d) A variância o% da distribuição amostral das médias é obtida subtraindo-se 
a média 6 de cada número de (1), elevando-se o resultado so quadrado, adicio- 
nando-se todos os 25 números assim obtidos e dividindo-se por 25. O resultado 
final é: 
ox! = 135/25 = 5,40; assim: oy = 5,40 = 2,32. 


Isso ilustra o fato de ser o 3? = 0%/N, pera populações finitas cuja emostragera 


seja tomada com reposição (ou para populações infinitas), visto que o segundo 
membro dessa expressão temo valor 10,8/2 = 5,40, que concorda com o resultado 
anterior. 
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2. Resolver o Probl. 1, no caso de amostragem sem reposição. 


Solução: 7 
Como nos itens (a) e (b) do Próbl. 1, p = 6 e q = 3,29. 
to) Há sC2 = 10 amostras de 2 elementos dessa população, extraídas sem re- 
posição, o que significa que é retirado um número e depois outro diferente do 
primeiro, & saber: . 
(2,3), (2 6), (2, 8), (2, 11), (3, 6), (3, 3), (3, 11), (6, 8), (6, 11), (8, 11). 
A seleção (2, 3), por exemplo, é considerada igual a (3, 2). 
As médias das amostras correspondentes são: 
25, 4,0, 50, 6,5, 4,5, 5,5, 7.0, 7,0, 8,5, 9,5, 
e e média da distribuição amostral, das médias é: 
o 25+40+50+65+45455+70+7,0 +85 +05 60 
ez o 10 TERN 
o que exemplifica o fato de ser MZ = 1, 
(d) A variância da distribuição amostral das médias é: 


p (25 60P + (40 — 60 + (5,0 = 6,0} + oie t (95 = 00 os 


E 10 
e cx=201. 
2 o? {f No- N i 
Isso é um exemplo de que 037! = (Nei), visto que o segundo 
Np— ; 


membro é igual a ae (= = 4,05, igual ao acima obtido, 


3, Admite-se que as alturas de 3 000 estudantes do sexo mas- 


8, 
culino dé uma úniversidade são normalmente distribuídas, com & 
média 17272em e o desvio padrão 7,62cm. Se forem obtidas 80 
amostras de 25 estudantes cada uma, quais serão a média e o desvio 
padrão esperados da distribuição amostral das médias resultantes se 
a amostragem fôr feita: (a) com reposição; (b) sem reposição ? 


Solução: 

O número de amostras de 25 elementos que podem ser obtidas tedricamente 
de um grupo de 3 000 estudantes, com e sem reposição, são: (3 000325 e 3009 Ops, 
respectivamente, muito maiores do que 80, Por isso não se obtém uma verdadeirs, 
distribuição amostral das médias, mas apenas uma, experimental. Apesar disso, 
visto que o número de amostras é grande, haverá uma concordância. muito estreita, 
entre as duas distribuições amostrais. Por isso, 2 média e o desvio padrão espe- 
rados estariam muito próximos dos da distribuição teórica. Por conseguinte: 

(a) ug =u = 172,72 em e og = civN = 762/4253 = 1,524 em. 


A 
(b) uz = p = 172,72 cm e oz- e fa 


— 182/3000 -25 
25 93000 1 
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que é apenas ligeiramente menor do que 1,524 cm e pode, portanto, para todos 
os fins práticos, ser considerado igual ao da amostragem 'com reposição. 


Em consegliência, poder-se-á esperar que a distribuição amostral experi- 
mental das médias seja aproximadamente normal, com à média 172,72 em ce o 
desvio padrão 7,82 em. 


4. Em quantas amostras do Probl. 3 pode-se esperar que a 
média se encontre: (a) entre 16957 em e 173,48em; (b) abaixo de 
169,65 cm? 


Solução: 
A média X de uma amostra, em unidades reduzidas, é dada, neste caso, por: 


pa ROME X-a 
E 1,524 


(a) 169,67 em em unidades reduzidas = (169,67 — 172,72)/1,524 = — 2,0; 
173,48 em unidades reduzidas = (173,48 — 172,72)/1,524 = 0,5. 


Proporção das amostras com a média entre 169,67 e 173,48 om = (área sub- 
tendida pela curva normal entre z = — 20 e s =0,5) = (área entre z = — 2 © 
2 = 0) + (área entre z = 0 e z = 0,5) = 0,4772 + 0,1915 = 0,6687. 


Então, o número esperado de amostras = 80 (0,6687) ou 53. 
(b) 169,66 em unídades reduzidas = (169,66 — 172,72)/1,524 = — 2,67. 


- Proporção das amostras com média inferior a 169,66 cm = (área subtendi- 
da pela curva normal à esquerda de # = — 2,67) = (área à esquerda de z = 0) — 
~ (área cntre z = — 2,67 e z = 0) = 0,5 — 0,4962 = 0,0038. 


Então, o número esperado de amostrás = 80 (0,0038) = 0,304 ou zero. 


5. Quinhentos rolamentos de esferas têm um pêso médio de 
5,02 onças e um desvio padrão de 0,30 onça. Determinar a proba- 
bilidade de uma amostra de 100 rolamentos de esferas, escolhidos 
ao acaso nesse grupo, ter um pêso total de: (a) entre 496 e 500 onças; 
(b) mais de 510 onças. i 


Solução: 
Para a. distribuição amostra! das médias, py = x = 5,02 onças. 


Rato 
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os Jz = [0200 a oor, 
Re N Mp1 O vão Ų 5001 


(e) O pêso total estará compreendido entre 4969 500 onças, quando o pêso 
médio dos 100 rolamentos de esferas estiver compreendido entre 4,96 e 5,0 onças. 

4,96 em unidades reduzidas = (4,96 — 5,02)/0,027 = — 2,22, ' 

5,00 em unidades reduzidas = (5,00 — 5,02)/0,027 = — 0,74. 

Probabilidade desejáda = (área entre z= — 2,22 e z= — 0,74) = 
= (área entre z = — 2,22 e z= 0)-— (área entre z= — 0,74 e z= 0) = 
= 0,4868 — 0,2704 = 0,2164. 


(b) O pêso total excederá a 510 onças, quando o pêso médio dos 100 rolamentos 
exceder a 5,10 onças. 


5;10 em unidades reduzidas = (5,10 — 5,02)/0,027 = 2,96. 


Probabilidade desejada = (área à direita de z = 2,96) = (área à direito, de 
z =.0) — (área entre z = 0 e z = 2,06) = 0,5 — 0,4985 = 0,0015. 


Por conseguinte, haverá sòmente 3 probabilidades em 2000 de escolher uma 
amostra de 100 rolamentos, cujo pêso totel exceda a 510 onças. 


Números aleatórios 


6. (a) Mostrar como selecionar 30 amostras aleatórias de 4 
estudantes cada (com reposição), na Tabela 2.1, pág. 43, mediante 
o emprêgo de números aleatórios. (b) Determinar a' média e o 
desvio padrão da distribuição amostral das médias do item (a), 
(c) Coinparar os resultados de (b) com os valores teóricos, explicando 
quaisquer discrepâncias. 


Solução: 


(a) Utilizam-se 2 algarismos para enumerar cada um dos 100 estudantes: 00, 
01, 02,...,99 (veja a Tabela 8.2). Em consequência, os 5 estudantes, cujas 
alturas estão entre 151 e 158 cm, são enumerados de 00 a 04; os 18 estudantes, 
cujas alturas estão entre 159 e 186 em, são enumerados de 05 a 22 eto, Cada 
número de estudante é denominado número amostral. Retiram-se, agora, números 
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amostrais do Apêndice VIL Tabela 8.2 

Na primeira linha, encontra-se a 
sequência Öl, 77, 27, 46, 40 etc, que Alturas Li cs . À Número 
serão considerados números amostrais (om) Fregiiência | à mostral 
aleatórios, cada um dos quais fornece- 
ré à altura de um determinado estu- 151 - 158 5 00 - 04 
dante. Em consequência, 51 corres- 159 - 166 18 05-22 
ponde a um estudante cuja altura 167 - 174 42 23 - 64 
está entre 167 e 174 cm, que se con- HE E o n on oa 
sidera igual à 170,5 em (ponto médio). E a, 
Semelhantemente, 77; 27, 46" corres- g 7 
pondem às alturas de 178,5, 170,5, Total 100 
170,5 cm, respectivamente. 4 


Por êste processo obtém-se a Tabela 8.3, que apresenta os números amostrais 
retirados, as alturas correspondentes e a altura média de cada uma das 30 amostras. 
Seria, de notar que, embora tivéssemos entrada no Apêndice VII, na primeira, 
linha, poderíamos ter iniciado em qualquer outra e escolhido qualquer amostra, 
especificado, i 

Tabela 8.3 


ú À l eu 
Dia eae Altura Correspondente tura 
- 27 — 46 |' 170 ~ 177 — 170 — 170 171,75 
= 33 — 12 170 — 169 — 169 — 163 167,75 
— 46 — 62 177 — 170 — 170 — 170 171,75 
— 98 — 93 165 — 170 — 185 — 185 176,25 
— 41 — 86 170 — 163 — 170 — 178 170,25 
— 08 — 70 165 — 170 — 164 — 178 171,75 
— 03 — 32 170 — 170 — 155 — 170 165,75 
—, 83 — 58 171 — 178 — 179 — 171 174,75 
— 68 — 21 178 — 178 — 179 — 164 174,75 
— 13 — 87 185 — 155 — 163 — 178 170,25 
— 51 — 08 177 — 163 — 168 — 163 167,75 
— 45 — 39 170 — 183 — 170 — 170 171,75 
— 45 — 98 164 — 179 — 171 — 185 174,75 
= Y3 — 52 184 — 155 — 178 — 170 i71,75 
— 54 — 24 163 — 178 — 170 — 170 170,25 
— 55 — 58 | -163 — 169 — 1609 — 170 167,75 
~ 97 — 43 178 — 171 — 185 — 171 176,25 
~ 93 — 50 178 — Mi — 185 — TA 176,25 
- 71 — 30 178 — W3 — 178 — IM 174,75 
~ 21 — 33 170 — 170 — 163 — 168 187,75 
— 74 — 54 178 — 178 — L8 — YA 176,25 
— 0d — 18 163 — 170 — 155 — 163 162,75 
— 12 — 97 |. 178 — 165 — 165 — 185 173,25 
— 69 — 88 171 — 178 — 178 — 178 176,25 
— 21 — 87 163 — 170 — 163 — 175 167,75 
— 57 — 93 156 — 170 — 170 — 185 170,25 
— 93 — 88 170 — 178 — 185 — 178 177,75 
— 96 ~ 79 173 — 163 — 185 — 178 174,75 
— 59 — 36 183 — 170 — 170 — 170 178,25 
— 08 — 84 163 — 163 — 163 — 178 164,25 


į 
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~ ~ Tabele 8.4 

p A 
* Médias Tabu- š i 2 
Amostrais lação i “ ju Je 

| 

` 162,75] 4 1 -5 zag 25 
16425) 7 1 -4 KA 16 
165,75 / 1 -3 es; 9 
167,25 0 —2 0 0 
168,75 DU 5 -1 -5 5 
A 170,25 VARA 4 0 0 0 
à 171,75 ATA + 1 4 & 
173,25 141 3 2 K 12 
174,75 TIAL 5 3 15 45 
176,25} FAU 5 4 20 20 
17775 |" 4 i 5 5 25 

e e je cão 

Bj=N=30 Bju = 88 | Bju? = 221 


(b) A Tabela 8.4 dá a distribuição de frequência das alturas médias das 
amostras obtidas no item (a). Ela é uma distribuição amostral das médias. A média 
e o desvio padrão são obtidos, como de costume, pelos métodos abreviados dos 
Cepítulos 3 e 4. ; : 

Média =A +o T= A+ sad = 170,25 + m (68) = 171,90 em. 


2 


= 2 2 
Desvio padrão = c Vw 2 =0 qe — (e) - 
3 
= 1,50 o E (5) = 3,12 0m. 

(c) A média teórica da distribuição amostral das médias, dada por HF, seria, 
igual à média populacional 4, que é 171,70 cm (veja o Probl, 22, Capítulo 3), que 
concorda com o valor 171,65 cm do item O) 

O desvio padrão teórico (êrro padrão) da distribuição amostral das médias, 
dado por cx, seria. iguala oN, em que o desvio padrão populacional é = 7,42 em 
(veja o Probl. 17, Capítulo 4) e o tamanho da amostra é N = 4. Visto que el N = 

= 7,42 omj vV 4 = 3,71 cm, êle concorda com o valor 3,58 em do item (b). As 
discrepâncias devem-se so fato de terem sido selecionadas apenas 30 amostras è 
de serem pequenos seus tamanhos. 


Distribuição amostral das proporções 
7. Determinar a probabilidade de, em 120 lances de uma moeda, 
honesta, ocorrerem caras: (a) entre 40 e 60%; (b) em 5/8 ou mais. 


Solução: 

Considerem-se os 120 lances de moeda como uma, amostra retira 
população infinita, constituida de todos os lances possíveis. Nessa população, b 
probabilidade do evento cara é p = 1/2 e a do evento coroa é q = 1 - 1/8. 


a de uma 
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iue os números prováveis de caras, em 126 
lances, esteja entre (40% de 3 e (60% de 120) = 72. Procede-se como 
no Capítulo, T; fazendo-se o ajustamento de uma normal à binomial. Como o 
número dê caras: é uma variável discreta, procura-se. a probabilidade do número 
de caras estar: situado entre 47,5 e 72,5. 


E É número ag de caras = Np = 120 ($) = 60 e 


= Neg = (24 


47,5 em unidades reduzidas = (47,5 — 60)/5,4 
72,8 em unidades reduzidas = (72,5 — 60)/5,4 
Probabilidade desejado. = (área subtendida pela curva, normal entre z = 
= — 228 e z= 2,28)= 2 (área entro z = 0 e z = 2,28) = 2(0,4887) = 0,9772. 


Outro método: 

Hp =p =$ = 0,50, cp = V pali = vV $ E20 = 0,0466. 
= (0,40 — 0,50)/0,0456 = — 2,19. 
(0,60 — 0,50)/0,0456 = 2,19. 

- Em consegitência, a probabilidade desejada é a área subtendids, pela curva 
normal entro (2.= — 2,19 e z = 2,19) = 2 (0,4857) = 0,97i4. 

Embora êste resultado seje preciso até centésimos, êle não concorda exata 
mente, visto que não se utilizou o fato da proporção ser uma variável discreta. 


40% era unidades reduzidas 
60% em unidades reduzidas 


aca : 1 do i 
Para levar isto em conta, subtrai-se 2» 7 303) de 0,40 e soma-se iN 7 


= E a 0,60. Por isso, a proporção pedida, em unidades reduzidas é, pôsto 

que L = 000417, CS Q007 = 0,50... 2,08 e Q60 + 000817 — 0,50. 
240 0,0456 0,0456 

= 2,28, de modo a obter-se a concordância com o primeiro método. 


Note-se que (0,40 — 0,00417) e (0,60 + 0,00417) correspondem às propor» 
- ções 47,5/120 e 72,5/120 do primeiro método acima. 


E (b) Medidnie o emprêgo do segundo método do item (a), encontra-se, pôste 
que 5/8 = 0,6259, (0,8250 — 0,00417) em unidades reduzidas = 


Probabilidade desejada = (área subtendida pela curvas normal à direita de 
z = 2,65) = (área à direito de z = O) — (área entre z =0 e z = 2,65) = 0,5 — 
— 0,4989 = 0,8040. i 


j 
i 
| 


é 
E 
iE. 

i 
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8. Cada pessoa-de um grupo de 500, lança uma moeda honesta 
120 vêzes. Quantas pessoas seria de esperar que relatassem ter obtido 
caras: (a) entre 40 e 80% de seus lances; (b) em 5/8 ou mais désses lances. 


Solução: 
Éste problema está estritamente relacionado ao anterior. Neste caso, con- 


sideram-se 500 amostras, de tamanho 120 cada uma, retiradas de ums população 
infinita, constituída de todos os lances possíveis da moeda. 


(a) No item (a) do Probl. 7 estabeleceu-se que, de tôdas as amostras pos- 
siveis, cada uma constituída de 120 lances de uma moeda, poder-se-ia esperar 
que se encontrassem 97,74% com uma percentagem de caras entre 40 e 00%. 
Em 500 amostras, portanto, pode-se esperar que ocorram cêrca de 97,74% de 500, 
ou 489 amostras com essa propriedade. Conclui-se que se pode esperar que 480 
pessoas relatem que suas experiências tiveram como resultado entre 40 e 60% 
de caras, 


É interessante assinalár que é de esperar que 500 — 489 = 11 pessoas rela- 
tassem que sua percentagem de caras não está compreendida entre 40 e 60%. 
Essas pessoas poderiam. concluir, razoâvelmente, que suas moedas estavara. vi» 
ciadas, mesmo que elas fôssem honestas. Fisse tipo de êrro é um risco sempre 
presente quando se trata de probabilidade. 

(b) Raciocinando como em (a), conclui-se que córca de (500X0,0040) = 2 
pessoas relatariam que 5/8, ou mais, de seus lances resultaram em cars. 


9. Verificou-se que 2% das ferramentas” produzidas "por uma, 
certa máquina são defeituosas. Qual é à probabilidade de, em uma 
remessa de 400 dessas ferramentas, revelarem-se defeituosas: (9) 3% 
ou mais; (b) 2% ou menos? 


Solução: 

up=p=0,02 e ap = VpaN = /0,0%0,98)/400 = 0,14/20 = 0,007. 

(a) Usando a correção para variáveis discretas, 1/2N = 1/800 = 0,00125, 

tem-se: E 
0,03 — 0,00125 — 0,02 
(0,03 — 0,00125) em unidades raguzidas = "amas = 1,25. 
0,007 
Probabilidade desejada = (área subtondida pela curva normal à direita de 
= 1,25) = 0,1056. 


Se não se tivesse feito correção, obter-se-ia 0,07684. 


“ Dutro método: 


48% de 400) = 12 ferramentas defeituosas. Baseado na continuidade, 12 ou 
mais ferramentas significam 11,5 ou mais. 


= (2% de 400) =8 e c=Nog= 
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Então, 11,5 em unidades reduzidas = (11,5 — 8)/2,8 = 1,25 e, como an- 

teriormente, a probabilidade desejada é de 0,1056. 
0,02 + 0,00125 — 0,02 - 

(o (002 + 0,00125) em unidades reduzidas = sR 007 — = 0,18. 

Probahilidade desejada = (res subtendide pela curva normel à esquerda 
de p= 0,18) = 0,5000 + 0,0714 = 0,5714, 

Se não tivesse sido feits a correção, cbter-se-ia 0,5000. Pode também ser 
wsado o segundo método do item (a). 


10. Uma prévia eleitoral mostrou que certo candidato recebeu 
46% dos votos. Determinar a probabilidade de uma seção eleitoral, 
constituída de (a) 200 ou (b) 1000 pessoas, selecionadas 20 acaso 
enire a população votante, apresentar a maioria de votos a favor 
dêsse candidato. 


Solução: . 
(a) HP =p =0,46 e op = paN = v 0,46(0,54)/200 = 0,0352. 
Como 1/2 N +=1/400 = 0,0025, a maioria estará indicada na amostra quando 
` a proporção & favor do candidato fôr (0,50 + 9, ,0025) = 0,5025 ou maior. (Esse 
proporção também pode ser obtida, se se recordar que 101 ou mais indicam a 
maioria mas, considerando s variável como contínua, o valor a adotar é 100,5 
e, dêsse modo, a Proporção é: 100, ,5/200 = O 5025.) 


“Então, 0, 5025 em unidades reduzidas : = (0,5025 - — -0 ,46)/0,0352 = 1 al 
Probabilidade desejada = (área subténdida pela curva normal à direita de 
2 = 1,21) = 0,5000 — 0,3869 = 0,1131. 
(b) uP =p = 0,48 e op = V PqlN = v 0,40(0,54)/1 000 = 0,0158. 
0,5025 em unidades reduzidas = (0,5025 — 0,46)/0,0158 = 2,69. 


idade desejeds = (dres subtendids pela curve normal à direita de 
2,99) = 0,5000 — 0,4964 = 9,0036. 


Distribuições amostrais de diferenças e somas 


li. Seje U, uma variável que representa qualquer dos elementos 
da população 3, 7, 8 e Us que representa qualquer dos elementos da 
população 2, 4. Calcular: (a) gm; (0) vos (O Boos (d) cw 
te) cm e (tD cu 


Solução: 
ta) ut, = média de população Dj = 1/3(3 +7 48) =6. 
(b) My, = médis ds população Ug = 1/2 (2 + 4) = 3. 
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(c) À população constituída pela diferença entre qualquer elemento de U; 


„e qualquer de Us, é 


3-2 7-2 8-2 1o 5:-6 

3-4 7-4 8-4 eu -1 3.4 
LES DADAS 

Então, ly, - y, = média de (U; ~ Us) = ES TSACD kB ts 


Êsse resultado é um exemplo do geral Em vz = Ryj m Hi, como pode 
ser visto em (a) e (b). 


(d) EA = variância da população U; = 5 
Já, T 
=F uy y E 


2 — 3}? + (4 — 3} 
(e) cb, = variância da população Uz = (Br drigo a = 
=1 ou fy, =l 
d) cã ~ į, = variância da população (U; — Uy)= 


= (1-3P +(5-33 + (60-32 +C 1-3} (3-8 + (43 


6 
= M 17 
Za N mma Ya 


É um exemplo do resultado geral para amostras independentes, Com = 
- Joh, + EA , como se pode ver em (d) e (e). 

12. As lâmpadas elétricas do fabricante A têm duração. média 
de 1400 horas, com-um desvio padrão de-200..horas, enquanto. que... 
as do fabricante B têm duração média de 1 200 horas, com um desvio 
padrão de 100 horas. Se forem ensaiadas amostras aleatórias de 125 
lâmpadas de cada marca, qual é a probabilidade das de marca A 
terem vida média maior do que as de B de pelo menos: (a) 160 horas; 
(b) 250 horas. 

Solução: 

Sejam X, e Xp as durações médias das amostras À e B, respectivamente. 


Então: 
BX4-Ep = EX4 — HXp = 1400 — 1200 = 200h 


2 2 2 2 
° za] qg + Op = q) (OL 4 sr = 20h. 
Na NB 5 1 


A variável reduzida, para diferença das médias, é: 
- Zac E- (8X Xo) (Ka Xp)- 20 
CXa-Ep 20 
e é, com aproximação suficiente, distribuída normalmente. 
(a) A diferença de 160 horas, em unidades reduzidas = (160 — 200)/20' = — 
Probabilidade desejada = (área subtendida pela curva normal à direita de 


z = — 2} = 0,5000 + 0,4772 = 0,9772. 
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(b) A diierença de 250 hores, em unidades reduzidas = (250 — 200)/20 = 


lade desejada = (áres subtendida pela curva normat à direita de 
z ='2,50) = 0,5000 — 0,4988 = 0,0082. 


13. Os rolamentos de esfera de uma certa marca pesam 0,50 
onça, com um desvio padrão de 0, 02 onça. Qual é a probabilidade 
de 2 lotes, de 1 000 rolamentos cada, um, diferirem, em pêso, de mais 
de 2 ongas? 


Solução: 
Sejam Žie F, os pesos médios dos rolamentos dos 2 lotes. Então: 
E, E + uy = 0,50 — 0,50 = 0, 


J 4 (002) {0,02} .. 0,000895. 


Na 1000 1000 
Eu . S ` X-X)-0 
A vsrigvel reduzido, para » diferença das médias, fs =! EE P 


e tem distribuição bem aproximadamente normal. 


A diferença de 2 onças entre os lotes é equivalente a uma, diferença de 2/1 000 = 
= 0,002 onça entre as médias. Ela pode ocorrer quando X, — F; z 0,002 ou 


= 0,002 — O é — 0002-0 
X- ~ 0,002, ies Z “ia 0,000895- = 223 o zS -0,000895 — = 


m 2,23. 


Então, Pri(z Z 223 ouz S$ — 2,23] = Priz E 2,23} + Priz S — 2,23] = 
“= 2(0,5000 ~- 0,4871) = 0,0258. 


i4. 4 e B jogam uma partida de “cara e coroa”, lançando 
cada um 50 moedas. A vencerá o jôgo se conseguir 5 ou mais caras 
do que B e, quando isso não ocorrer, B vencerá. Determinar as 
vantagens contra a vitória de 4 em qualquer jogada particular. . 


Solução: 


Sejam Pae Pp as proporções de “caras” obtidas por A e B. Admitindo-se 
que tôdas na moedas são honestas, a probabilidade p de caras é 1/2. Então: 


deacro =Ppym Peg™Ie Tp. nja, = 


cap, 2L a E x 
q NA : NB q2 9:10; 


reduzida, para & diferença em proporções, é2 = (PA - PB - 0)/0,10. 


Á variável 
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Considerando-se que a variável é continua, 5 ou mais cares significam 4,5 
ou mais, de modo que a diferença, em proporções, seria, 4,5/60 = 0,09 ou meis, 


“ isto é, z será superior ou igual a (0,09 -- 0)/0,10-= 0,9 (ou z & 0,09). A probabili- 


dade correspondente é a área subtendida pela curva normal, à direito de z = 0,9, 
que é (0,5000 — 0,3159) = 0,1841, 

Em consegiiência, as vantagens contra a vitória de A são de (t = 0,1841) + 
+ 0,1841 = 0,8159 + 0,1841, ou de 4,43 para 1. 

— 15. As medidas de duas distâncias são 27,3 m'e 15,6 m, com os 
desvios padrões (erros padrões) de 0,16m e 0,08m, respectivamente. 
Determinar a média e o desvio padrão da: (a) soma; (b) diferença 
das distâncias. 

Solução: 

Se as distâncias forem representadas por D; e Dp então: 

(a) Epa Da = Pp, t Ep = 27,3 + 15,6 = 42,9 metros; 
Toan = Yoh, +ob, = v 0107 + (0,08 = 0,18 metro. 

(W) “n-p: ™ Po- tm = 27,3 — 15,6 = 11,7 metros; 
Th- D= ya, re ER = (0,16)? + (0,08? = 0,18 metro. 


16. Um certo tipo de lâmpada elétrica tem vida média de 1500 
horas, com o desvio padrão de 150 horas. Três lâmpadas são insta- 
ladas de modo que, quando uma se queima, outra começa a funcionan 
Admitindo-se que as vidas médias são normalmente distribuídas, qual 
é a probabilidade da iluminação estar assegurada durante: (a) pelo 
menos 5000 horas; (b) no máximo 4200 horas? 


Solução: 

Admita-se que as vidas médias sejam Li, Lo e Lg. Então: 

Hisy Los La E Pr + Bro + Bia = 1500 + 1500 + 1500 = 4500 horas; 
. Li+ Lesta = J, + ha + da = 3O50 = 260 horas. 


(a) 5000 horas em unidades reduzidas = (5000 — 4 500)/260 = 1,92. 


Probabilidade desejada = (área subtendida pela, curva normal, à direita de 
= 1,92) = 0,5000 — 0,4726 = 0,0274. ; 
(b) 4200 horas em unidades reduzidas = (4200 — 4 500)/260 = — 1,15, 
a Probabilidade desejada = (área subtendida pela curva normal, à esquerda 
de z = — 1,15) = 0,5000 — 0,3749 = 0,1251. 


Problemas diversos 

17. Com referência ao Probl. 1, determinar: (a) a média da 
distribuição amostral das variâncias; (b) o desvio padrão da mesma 
distribuição, isto é, o êrro padrão das variâncias. 
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Solução: 


(a) As variâncias amostrais, correspondentes às 25 amostras do Probl. 1, são: 


0 025 -4;00 9,00 20,25 
0,25 0 2,25 6,25 16,00 
4,00 2,25 0 1,00 6,25 
9,00 6,25 1,00 9 2,25 

20,25 16,00 6,25 2,25 0 


A médis, da distribuição amostral das variâncias é: ` 


soma de tódas as variâncias da tabela acima _ 135  „ 
ua = 35 e 5,40. 


É exemplo de que u, = (N — 1) (0°)N, visto que, para N = 2e o? = 10,8 


[veja o Probl. 1(b)), o valor do segundo membro é 3 (10,8) = 5,4. 


O resultado mostra a netessidade de definir uma variância corrigida para as 


AM Nos 
amostras, como $*= s 
? N-1 


Seguir-se-ia, então, que #32 = o? (veja também as observações da pág. 111). 
Dever-so-ia assinalar que as variâncias populacionais seriam definidas da mesma 
forma anterior e que sômente as amostrais seriam corrigidas. 


(b) A variância da distribuição amostral das yariâncias, ESA é obtida sub- 
traindo-se a média 5,40 de cada um dos 25 números da tabela acima, elevando-se 
êsses números ao “quadrado, somando-os ¢, depois, dividindo-se o resultado por 25. 
Assim: 

ola 575,75/25 = 23,03 ou 6,2 = 4,80. 


18. Resolver o problema anterior, quando a amostragem fôr sem 
reposição. 
Solução: 
(a) Há 10 amostras cujas variâncias são dadas pelos números acima (ou abaixo) 
da diagonal de zeros da tabela do Probl. 17(a). Então: 


0,25 + 4,00 + 9,00 + 20,25 + 2,25 + 0,25 + 16,00 + 1,00 + 6,25 +2,25 _ 
10 E 


Ba = 
+ 
“= 6,75. 
Esse é um caso particular do resultado geral: gy = G5) (+ 

Np-1 N 
g?, como se verifica fazendo-se Np = 5, N = 2 e 0? = 10,8, no segundo membro, 
5 1 
e obtendo-se p, = (5) (+) (10,8) = 6,7: 


(b) Subtraindo 6,75 de cada um dos 10 números acima da diagonal de zeros, 


da tabela do Probl. 17(a), clevando-os ao quadrado, somando-os e, depois, . 


dividindo-se por 10, encontra-se ct = 39,675 ou Sz = 6,30. 
s 


19. O desvio padrão dos pesos de uma população muito grande 
de estudantes é 5 kg. Tiram-se, dessa população, amostras de 200 
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estudantes cada uma, e calculam-se os desvios padrões dos pesos, em 
cada amostra. Determinar: (a) a média; (b) o desvio padrão da 


“distribuição amostral dos desvios padrões. 


Solução: 

Pode-se considerar que a amostragem provém de uma população infinita 
ou de ums finita com reposição. De acôrdo com o exposto na pág. 239: 

(a) Média da distribuição amostral dos desvios padrões = Hy = € = 5 kg. 

(b) Desvio padrão da distribuição amostral dós desvios padrões =: 
‘= a, = af 2N = 5/4400 = 0,25 kg- 


20. Que percentagem das amostras, no problema anterior, teria 
desvios padrões: (a) superior a 5,5 kg; (©) inferior a 4,4 kg? 


Solução: 
A distribuição amostral dos desvios padrões é, aproximadamente, normal 
com a média 5 kg e o desvio padrão 0,25 kg. 
(a) 5,5 kg em unidades reduzidas = (5,5 -- 5)/0,25 = 2,0, Área subtendida 
pela curva normal, à direita de z = 2,0 é: 
(0,5 — 0,4772) = 0,0228. Então, a percentagem pedida é 28% 
(b) 44kg em | unidades "reduzidas = (4,4 — 5,0)/0,25 = — 2,4. Ávea sub- 
tendida pela curva normal, à esquerda de z = — 2,4 6: ; 
(0,5 — 0,4918) = 0,0082. Então, a percentagem pedida é 0,8% 


Distribuição amostral das médias 

21. Uma população consta de 4 números: 3, 7, 11, 15. Considerar tôdas as 
amostras possíveis de: 2 elementos, que podem ser retiradas com reposição. De- 
terminar: (a) a média populacional; (b) o desvio padrão da população; (c) a média, 
da distribuição amostral das médias; (d) o desvio padrão da distribuição amostral 
das médias. Verificar (c) e (d) diretamente, por meio de (a) e (b), usando as fór- 
mulas apropriadas. 

Resp.: (a) 9,0; (b) 4,47; (c) 9,0; (d) 3,16. 

22. Resolver o Probl. 21, quando a amostragem fôr sem reposição. 

Resp.: (a) 9,0; (b) 4,47; (c) 9,0; (d) 2,58. 

23. Os pesos de 1500 rolamentos de esferas são normalmente distribuídos, 
com a média de 22,40 onças e o desvio padrão de 0,48 onça, Se são extraídas 
300 amostras aleatórias de 36 elementos dessa população, determinar a média e 
o desvio padrão esperados da distribuição amostral das médias, quando a amos- 
tragem fôr feita: (a).com reposição; (b) sem reposição. i 

Resp.: (a) HY = 22,40 onças, y = 0,008 onça; (b) HY = 22,40 onças, 

= ligeiramente inferior a 0,008 onça. 
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24, Resolver o Probl. 23 se a população constar de 72 rolamentos de 
: esferas: 


E vesp (a) KẸ = 22,4 onças, OF 
= 0,0057 onga, 

25. No Probl. 23, quantas das amostras aleatórias teriam suas médias 
` (a). cntie. 22,39 e 22,41 onças; (b) maior do que 22,42 onças; (c) menor do que 
` 22,37 onças; (d) menor do que 22,38, ou maior do que 22,41 onças? 

á Resp.: (a) 237; (b) 2; (c) nenhuma; (d) 34. 

26. Certas válvulas fabricadas por uma companhia têm uma vida média de 

800 horas e desvio padrão de 60 horas. Determinar a probabilidade de uma amostra 
aleatória de 16 válvulas, retiradas do grupo, ter a vida média: (a) entre 790 e 810 
horas; (b) inferior a 785 horas; (c) superior a 820 horas; (d) entre 770 e 830 horas. 

Resp.: (a) 0,4972; (b) 0,1587; (c) 0,0918; (d) 0,9544. 

27. Resolver o Probl. 26, se fôr tomada uma amostra aleatória de 64 

válvulas. Explicar a diferença. 

Resp.: (a) 0,8164; (b) 0,0228; (c) 0,0038; (d) 1,0000. 

28. Os pesos dos fardos recebidos por um depósito têm ums média de 

150 kg e um desvio padrão de 25 kg. Qual é æ probabilidade de 25 fardos, rece- 
bidos ao acaso e carregados em um elevador, não exceder o limite específico de 
segurança désté último, que é de 4 100 kg? 

Resp.: 0,0026. 


Números aleatórios 


0,008 onça; (b) KY = 22,4 onças, F = 


29. Resolver o Probl. 6, utilizando vários conjuntos de números aleató- 
rios, e selecionando: (a) 15; (b) 30; (c) 45; (d) 60 amostras de 4 elementos, com re- 
posição. Comparar com os resultados teóricos de cada caso. 

30, Resolver o Probl. 29, selecionando amostras de: (a) 2; (b) 8 elementos, 
com reposição, em vez de 4. ` 

31: Resolver o Probl. 6, se a amostragem fôr sem reposição. Comparar 
com os resultados teóricos. : 

32. (a) Mostrar como podem ser selecionadas 30 amostras dê 2 elementos 
da distribuição do Probl. 61, Capítulo 3. (b) Calcular a média c o' desvio pa- 
drão da distribuição amostral de médias resultantes e comparar com os teóricos. 

33. Resolver o problema precedente, utilizando amostras de 4 elementos. 
Distribuição amostral das proporções 

%4, Determinar 9 probabilidade de, entre 200 crianças nascidas: (a) menos 
de 40% serem homens; (b) entre 43 e 57% serem meninas; (c) mais de 54% 
età meninos. Considerar s mesma probabilidade de nascimento de meninos 
: e meninas. aê i 

Resp.: (a) 0,0019; (b) 0,9596; (e) 0,1151. . 

3 Entre 1000 amostras de 200 crianças cada uma, em quantas se esperaria 
encontrar: (a) menos de 40% de meninos; (b) entre 40 e 60% de. meninas; (c) 
53% ou mais de meninas. 


st 


“e explicar as dif 
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Resp.: (a) 2; (b) 996; (c) 218. 
36. Resolver o Probl. 34, se forem consideradas 100 crianças em vez de 200, 
sultados. 

Resp.: (a) 0,0476; (6) 0.8664; (0) 0, 1841. 

37. Uma urna contém 80 bolas de gude, das quais 60% são vermelhas e 40% 
são brancas. Entre 50 amostras de 20 bolas cada, selecionadas da urna com repo- 
sição, quantas amostras se pode esperar que sejam constituídas de: (a) núme- 
ros iguais de bolas brancas e vermelhas; (b) 12 vermelhas e 8 brancas; (e) 8 
vermelhas e 12 brancas; (d) 10 ou mais brancas ? 

Resp.: (a) 6; (b) 9; (c) 2; (d) 12. 

38. Planejar uma experiência que exemplifique os resultados do Probl. 37. 


. Em vez de bolas brancas e vermelhas, podem ser usados pedaços de papéis, nas 


proporções corretas, nos quais estejam escritas as letras V e B. Que erros podem 
ser introduzidos, quando se empregam dois conjuntos diferentes de moedas? 

39. Um fabricante faz a remessa de 1000 lotes de “100 lâmpadas elétricas 
cada um. Se 5% das lâmpadas são normalmente defeituosos, em quantos lotes 
pode-se esperar que existam: (a) menos de 90 lâmpadas boas; (b) 98 ou mais lâm- 
padas boas? 

Resp.: (a) 6; (b) 125. 


Distribuição amostral de diferenças e somas 


40. 4 e B fabricam dois tipos de cabos que têm tensões médias de ruptura 
de 2000 e 2250kg e desvios padrões de 150 e 100 kg, respectivamente. Se 100 
cabos da marca À e 50 da marca B forem ensaiados, qua! é a probabilidade da 
tensão média de ruptura de B ser: (a) pelo menos 300 kg maior do que a de A; 


f (b) pelo menos 225 kg maior do que a de A? 


Resp.: (a) 0,0077; (b) 0,8869. 
4l. Quais são as probabilidades do Probi. 40, se forem ensaiados 100 


` cabos de ambas as marcas? Justificar as diferenças. 


Resp.: (a) 0,0028; (b) 0,9172. 


42, O escore médio dos estudantes, em um teste de aptidão, é de 72 pontos, 
com o desvio padrão de 8 pontos. Qual é a probabilidade de dois grupos de estu- 
dantes, constituídos de 28. 36, respectivamente, terem seus escores médios diver- 


. gentes de: (a) 3 ou mais pontos; (b) 6 ou mais pontos; (c) entre 2 e 5 pontos? 


Resp.: (a) 0,2150; (b) 0,0064; (c) 0,4504. 


43. Uma urna contém 60 bolas de gude vermelhas e 40 brancas. Retiram-se 
da urna dois conjuntos de 30 bolas cada um, com reposição, è anotam-se suas 
côres, Qual é a probabilidade dos dois conjuntos diferirem de 8 ou mais bolas 
vermelhas ? 

Resp.: 0,0482. 


44. Resolver o Probl. 43, quando a amostragem na obtenção de cada con- 


. junto fôr sem reposição. | 


Resp.: 0,0136. 
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45. Os resultados de uma eleição mostram que certo candidato recebeu 65% 
dos votos. Determinar a probabilidade de duas amostras aleatórias, constituída 
cada uma de 200 eleitores, indicarem mais de 10% de diferença nas proporções 
dos que votaram a seu favor. 

Resp.: 0,0316. 

46. Be Ure Uz são os conjuntos de números do Probl. 11, verificar que: 

(O) rms tro, ev; O) uau, = Voy, +ou, 


47, Três pesos são determinados com os valores 10,24, 17,99 e 31,17 kg, com 
o desvio padrão de 0,11, 0,23 e 0,27 kg, respectivamente. Determinar: (a) a média; 
(b) o desvio padrão da soma dos pesos. . 

Resp.: (a) 59,40 kg: (b) 0,37 kg. 

48. A voltagem média de uma bateria é 15 volts e o desvio padrão 0,2 volts. 
Qual é a probabilidade de 4 dessas baterias, ligadas em série, apresentarem uma 
voltagem total de 60,8 ou mais volta ? 

Resp.: 0,0228. 


Problemas diversos 


49. Uma população de 7 números tem média 40 e desvio padrão 3, Se forem 
retiradas dessa população amostras de cinco elementos e fôr calculada a variância 
de cada amostra, determinar a média da distribuição amostral das variâncias, 
quando a amostragem fôr tomada: (a) com reposição; (b) sem reposição ? 

Resp.: (a) 7,2; (b) 8,4. a 

50. Certas válvulas produzidas por ums companhia têm vida média de 
900- horas.e desvio padrão de -80 horas. A companhia envia 1 000 lotes de 100 
válvulas cada um. Em quantos lotes pode-se esperar que: (a) a vida média exceda 
à 910 horas; (èb) os desvios padrões da vida média excedam a 95 horas? Que 
hipóteses podem ser feitas? 

Resp.: (a) 106; (b) 4, 

51. No Probl. 50, se o vida mediana é de 900 horas, em quantos lotes 
pode-se esperar que a vida mediana exceda a 910 horas? Comparar as respostas 
com'as do Probl. 50(a) e justificar os resultados. 

Resp.: 159. 

52. Num exame, os graus foram normalmente distribuidos, com a média 72 
e o désvio padrão 8. (a) Determinar o grau mínimo dos 20% de estudantes mais 
bem colocados. (b) Determinar a probabilidade de, em uma amostra aleatória 
de 100 estudantes, o grau mínimo dos 20% mais bem colocados ser menor do que 76. 

Resp.: (a) 78,7; (b) 0,0090. 


CaríruLo 9 


TEORIA ESTATÍSTICA DA ESTIMAÇÃO 


Estimação de parâmetros 


No último capítulo, viu-se como a teoria da amostragem pode 


“ser empregada para a obtenção de informação relativa a amostras 


retiradas ao acaso de uma população conhecida: Do ponto de vista 
prático, entretanto, é fregiientemente mais importante poder deduzir 
informações relativas a uma população, mediante a utilização de 


estatística, que utiliza os princípios da teoria da amostragem , 

Um problema importante da inferência estatistica é a estimação 
dos parâmetros populacionais ou, abreviadamente, parâmetros (tais 
como a média, a variância da população etc), deduzidos da esta- 
tística amostral correspondente, ou, abreviadamente, estalística (isto é, 
a média, a variância da amostra, ete): Esse problema será conside- 
rado neste capítulo. 


Estimativas imparciais 


Se a média da distribuição amostral de uma estatística fôr igual 
ao parâmetro populacional correspondente, a estatística será deno- 
minada estimador imparcial do parâmetro e, se isso não ocorrer, ela 
será estimador parcial. Os valores correspondentes dessas estatísticas 
são denominados estimativas imparciais ou parciais, respectivamente. 


Exemplo 1. A média da distribuição amostral das médias, Hz é igual a m, 
isto é, à média populacional (veja a pág. 238). Por isso, a média amostral X é 
uma estimativa imparcial de populacional p. 


ESTATÍSTICA 


A média da distribuição amostral das variâncias H? é igual a 


RR. dei 
g’, em que 6? éa variância populacional e No tamanho da amostra 


No. 
(veja à pág 


39). Então, a variância amostral s? é uma estimativa parcial da 


variância populacional 9%. Adotando-se a variância modificada, S= aA 


verifica-se quê ap 6 igual a g?, de modo que 32 é uma estimativa imparcial de ot. 
Entretanto, 8 é uma estimativa parciai 42 g. ` 


Em têimos de esperança matemática (veja o Capítulo 6) po- 
der-se-ia dizer que uma estatística é imparcial quando sua esperança 
é igual ao parâmetro populacional correspondente. Então, X e 8º 
são imparciais, porque E) =u e E(S) = P. 


Estimativas eficientes 


Se as distribuições amostrais de duas estatísticas têm a mesma 
média (ou esperança), a estatística de menor variância é denominada 
estimador eficiente da média, enquanto que as demais recebem a 
denominação de estimador ineficiente. Os valores correspondentes das 
estatísticas são denominados estimativas eficientes ou ineficientes, 
respectivamente, 


Considerando-se tôdas as estatísticas possíveis, cujas distribui- 
ções amostrais têm a mesma média, a- de menor variância é, às vêzes, 
denominada a mais eficiente ou O melhor estimador daquela média. 


Exemplo: As distribuigios amostrais da média e da mediana têm, ambas, 
a mesma média, que é à popuiacional, Entretanto, a variância, da, distribuição 
amostral das médias é menor do que a de distribuição amostral das medianas (veja 
a pág. 239). Por isso, à média amostral dá uma estimativa eficiente da popula- 
cional, enquanto que a mediana amostral dá, para cla, uma estimativa, ineficiente . 

De tôdas as avaliações estatísticas de média populacional, a 
média amostral é a que proporciona a estimativa melhor ou mais 
eficiente. f 

Na prática, as estimativas ineficientes são frequentemente usadas, 
por causa da relativa facilidade com que algumas delas podem ser 
obtidas. ` 


Estimativas por pontos e por intervalos. Fidedignidade ` 


A estimativa de um parâmetro populacional, dada por um número 
único, é denominada, estimativa por pontos. A estimativa de um parâ- 
metro popijiacional, dada por dois números, entre os quais pode-se 


-ança de 08,27, 95; 
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considerar que êle esteja situado, é denominado estimativa por inter- 
valos. 


As estimativas por intervalos indicam sua precisão ou exatidão 
e são, portanto, preferíveis às estimativas por pontos. 


Exemplo: Dizendo-se que uma distância tem para medida 5,28 m, está se 
apresentando uma estimativa por pontos. Se, por outro lado, se disser que & dis- 
tância mede 5,28 + 0,03 m, isto é, que ela está compreendida entre 5,25 e 5,31 m, 
apresenta-se uma estimativa por intervalos. 


A declaração do êrro ou precisão de uma estimativa é frequente- 
mente denominada, sua fidedignidade. 


Estimativas do intervalo confiança dos parâmetros 


populacionais 


Sejam us e og a média e o desvio padrão (êrro padrão) da dis- 
tribuição amostral de uma estatística S. Então, se a distribuição 
amostral de S é aproximadamente normal (o que se tem verificado 


ser verdade para muitas estatísticas, quando o tamanho da amostra ` 


N > 30), pode-se esperar que se encontre uma estatística amostral 
real, S, situada nós intervalos de ug — Og & Mg + gg, de ug — 20g à 


“us + 20s, ou, de us— 305.8 Hs + 306, aproximadamente, em 68,27, 


95,15 e 99,73% de vêzes, respectivamente. 


De modo equivalente, pode-se esperar, ou estar confiante de 
encontrar-se ug nos intervalos de 8 — dg a S + as, de S — 205 à 
S + 20g ou de S — 30g a S + 305, aproximadamente, em 68,27, 
95,45 e 99,73% de vêzes, respectivamente. Por êsse motivo, êsses 
intervalos: serão denominados, respectivamente, intervalos de confi- 
e 99,73% para a avaliação de us. Os números 
extremos dêsses intervalos (S + dg, St 20s, S 805) são então 
denominados limites de confiança de 68,27, 99,45 e 99,73% e, algumas 
vêzes, limites fiduciais. 


De modo semelhante, S + 1,9605 e S + 2,580 são limites de 
confiança de 95 e 99% (ou 0,95 e 0,99) para §. A percentagem de 
confiança é frequentemente denominada nível de confiança. Os núme- 
ros 1,96, 2,58 ete, dos limites de confiança, são denominados. coefi~ 
cientes de confiança ou valores críticos, e representados por Ze: Os coe- 
ficlentes de confiança podem ser deduzidos dos níveis de confiança 
e reciprocamente. ` 
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A Tabela 9.1 dá os valores de z, correspondentes a vários níveis 
de confiança adotados na prática. Para os que não constam na 
tabela, os valores de z, podem ser encontrados nas tabelas de áreas 
da curva normal (veja o Probl. 7). AR 


Tabela 9.1 


Limite de 
confiança | 99,73% 99% 98% 96% 95,45% 95% 90% 80% 68,27% 50% 


300 258 2,83 205 2,00: 1,96 1,645 1,28 1,00 -0,6745 


Estimativas do intervalo de confiança das médias 


Se a estatística S é a média amostral X, então os limites de con- 
" fiança de 95 e 99%, para a estimação da média populacional u, são 
- dados por Ẹ + 1,960y e X= 2,580, respectivamente. 

De um modo geral, os limites de confiança são dados por X = 
= 2,0%, em que x, que depende de um determinado nível de con- 
fiança particularmente desejado, pode ser tirado da tabela acima. 
Adotando-se os valores de ox obtidos no Capítulo 8, verifica-se que os 
“limites de confiançã, pata a média populacional, são dados por: 


Faço ~ W 


no caso da amostragem de uma população infinita, ou tirada, com 
reposição, de uma população finita, e por: 
5 o IN,- N 
E a m Ya 
rE VE NNI’ 


(2) 


quando a amostragem tiver sido extraída sem reposição, de uma po- 
pulação finita de tamanho Np. 


Em geral, o desvio padrão da população, o, é desconhecido, de 
modo que, para se obterem os limites de confiança acima, emprega-se 
a estimativa da amostra, 3 ou s. Isso será satisfatório desde que 
N 230: Para N < 30, a aproximação é insuficiente e deve ser em- 
pregada a teoria das pequenas amostras (veja o Capítulo 11). 


+ 
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Intervalos de confiança das proporções 


Se a estatística S é a proporção dos “sucessos” de uma amostra 
de tamanho N, retirada de uma população binomial, na qual p é 
aquela proporção (isto é, sua probabilidade), os limites de confiança 
de p são dados por P + zp, em que P é a proporção dos sucessos 
da amostra de tamanho N. Adotando-se os valores de dp obtidos 
no Capítulo 8, verifica-se que os limites de confiança da propor 
ção da população são dados por: 


Praqli-P ico, (3) 


no caso da amostragem de uma população infinita, ou tirada, com 
xeposição, de uma população finita, e por: i 


z ia (8 


quando a amostragem tiver sido extraída com reposição, de uma 
população finita de tamanho Np. ` 


Para calcular êstes limites de confiança pode-se empregar a 


“estimativa da amostra P, para o valor dé $, ó que, de modo" geral e 


será satisfatório quando N 80, É apresentado, no Probl. 12, 
um método mais exato para a obtenção dêsses limites de confiança. 


Intervalos de confiança das diferenças e somas 


Se Sı e S2 são as estatísticas de duas distribuições amostrais apro- 


. ximadamente normais, os limites de confiança das diferenças dos 


parâmetros populacionais, correspondentes a Sı e Sz, são dados por: 


Si — Sa k h Cosg = Si — Se E l V os? F og", (5) 


- enquanto que os limites de confiança da soma dêsses parâmetros o 


são por: 
Si + SH ze SS E te V Os) Dos, (6) 


contanto que as amostras sejam independentes (veja o Capítulo 8). 
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Por exemplo, os limites de confiança da diferença de duas médias 
populacionais, no caso das populações serem infinitas, são dados por: 


(2) 


em que Ži, 01, Nye Ža, 02, No são as médias, os desvios padrões e 
os tamanhos respectivos de duas amostras retiradas das populações. 

De modo semelhante, os limites de confiança da diferença de 
duas proporções de populações infinitas são dados por: 


Pa (1 — pa) 
Ni $ 
(8) 
em que P, eP: são as duas proporções amostrais, Mı e No» são os 


tamanhos das duas amostras retiradas das populações e pı e pz são 
as proporções das duas populações (estimadas em Pı e P»). 


Pi = PaE 20 p p = P- Pta, q2 CF Pı) | 
` 1 


Intervalos de confiança dos desvios padrões 


Os limites de confiança do desvio padrão q, de uma população 


desvio padrão é s, são dados por: 
e 
| SERT da = 9 
mediante 0. emprêgo da Tabela 8.1, da pág. 239. No cálculo dês- 
ses limites de confiança usa-se $ ou $ para a avaliação de o. 


rro provável 


Os limites de confiança de 50% dos parâmetros populacionais, 
correspondentes a uma estatística S, são dados por S + 0,6074508. 
O valor de 0,6745 og é conhecido como o êrro provável da estimativa. 


“e Problemas Resolvidos 
Estimativas imparciais è eficientes . 
3. Dar um exemplo de estimadores (ou estimativas) que sejam: 


(a) imparciais e eficientes; (b) imparciais e ineficientes; (c) parciais 
e ineficientes. fi 


normalmente distribuída, quando fôr deduzido de uma amostra cujo - 
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Solução: 


(a) A média da amostra X e a variância amostral corrigida SE 
são dois dêsses exemplos. 


(b) A mediana e a estatística do amostra 3 (Qi + Qu), em que Qi e Qa são 
os quartis mais baixo e mais alto da amostra, são dois exemplos. Ambas as esta- 
tísticas são estimativas impareiais da média populacional, visto que a média 
de suas distribuições amostrais é a média populacional, 

(c) O desvió padrão da amostra s, o corrigido 8, o médio e a amplitude 
semi-interquartílica são quatro exemplos. 


2. A amostra constante de cinco medidas do diâmetro de uma 
esfera foi registrada por um cientista com os valores 6,33, 6,97, 
8,36, 6,32 e 6,37 cm. Determinar as estimativas imparciais e eficientes 
da: (a) média verdadeira; (b) variância verdadeira. 


Solução: 

(a) Estimativa imparcial e eficiente da média verdadeira (isto é, a média 
populacional) == 

-F= EX 633 +6,87 + 0,36 + 6,32 +637 
N 5 

(0) Estimativa imparcial e eficiente da variância verdadeira (isto é, a va- 
riância populacional) = 
a BA-FP 

N-1 


= 6,35 em. 


= (6,38 6,35)? + (6,97 — 6,85)? + (6,36 — 6,85) + (6,32—6,35) + (6,37 — 6,35)? M 
a 5-1 
= 0,00055 cm?. 
Note-se que $ = /0,00055 = 0,023 é uma estimativa do desvio padrão 
verdadeiro, mas ela não é imparcial nem eficiente. 


3. Admita-se que as alturas de 100 estudantes do sexo masculino 
da Universidade XYZ representam uma amostra aleatória das 
alturas de todos os 1 546 estudantes dessa universidade. Determinar 


“uma. estimativa imparcial e eficiente da: (a) média, verdadeira; (b) 


variância verdadeira. 
“Solução: 
(a) De acôrdo com o Probl. 22, Capítulo 3: 


Estimativa imparcial e eficiente da altura média verdadeira = É = 171,70 em. 
(b) . De àcórdo com o Probl. 17, Capítulo 4: 
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Estimativa imparcial e eficiente da variância verdadeira = = 
N ` 100 


Ei OO O 465 
NOT 99 (60,64) = 62,4659. 


9. Note-se que, como N é grande, não há dife- 
T? ou entre se $. 


-se que não se tem empregado e correção de Sheppard para os agru- 
pamentos. Se cla fôsse levada em conta, o valor a adotar acima seriá s = vV 55,25 = 
= 7,43 (veja o Probl. 21, Capítulo 4). 


4. Apresentar uma estimativa, imparcial e ineficiente da média 
verdadeira dos diâmetros das esferas do Probl. 2. 

Solução: 

A mediana é exemplo de uma estimativa imparcial e incficiente da média 


populacional: Dispostas as cinco medidas em ordem de grandeza, à mediana é 6,36. 


Estimativas do intervalo de confiança das médias 
populacionais 


5. Determinar os intervalos de confiança de: (a) 95%; (bd) 99%, 
. para a avaliação da altura média dos estudantes da, Universidade 
. XYZ, do Probl, 3. 


Solução: 


(a) Os limites de confiança de 95% são: X + 1,960/VN. Adotando-se 
X = 171,70 em, e considerando $ = 7,79 em como a estimativa de o (veja o 
Probl. 3), os limites de confiança são: 171,70 Æ 1,96 (7,79/ V100) ou 171,70 = 
1,45 


cm. Por conseguinte, o intervalo de confiança de 95% para a média da 
população, #, é de 170,25 a 173,15 cm, o que pode ser representado por 170,25 < 
< u < 173,15. 


Pode-se, portanto, dizer que a probabilidade da altura média da população 


estar compreendida entre 170,25 e 173,15 em é, aproximadamente, de 95% ou. 


0,95. Simbólicamente, escreve-se: Pr(170,25 <  < 173,15] = 0,95. Isso equi- 
vale a dizer que se está 95% confiante de que a médis populacional (ou verdadeira) 
está compreendida entre 170,25 e 173,15 em. 


(b) Os limites de confiança de 99% são X + 2,58 cj N=X + 2,58 SIN = 
= 171,70 + 2,58 (7,7914100) = 171,70 = 2,01 em. Em conseqiência, o inter- 
valo de confiança de 99% da média populacional, x, é de 169,69 até 173,71 cm, 
o que pode ser representado por 169,69 < u < 173,71. 

Na obtenção dos intervalos de confiança acima, admitiu-se que a população 
erà infinita, ou tão grande que se poderia considerar que as condições fôssem as 
mesmas da amostragem tomada com reposição. Para populações finitas, cuja 


amostragem fôr extraída sem reposição, usar-se-ia 
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e " E E 
de -== . Entretanto, pode-se considerar o fator 


N 
Np- o 


como sendo praticamente igual a 1,0, de modo que é desnecessário o emprêgo 
daquela expressão. Se ela fôr usada, os limites de confiança acima tornar-se-ão 
171,70 Æ 1,42 e 171,70 + 1,85 cm respectivamente. 


6. As medidas dos diâmetros de uma amostra alentória de 200 
rolamentos esféricos produzidos por certa máquina, durante uma 
semana, apresentam a média de 0,824 polegada e o desvio padrão 
de 0,042 polegada. Determinar os limites de confiança do: (a) 95%; 
(b) 99%, para o diâmetro médio de todos os rolamentos esféricos, 


Solução: 


(a) Os limitos de confiança de 95% são: Ñ = L,960/4/N =X «e 1,96S/V N = 
= 0,824 «+ 1,96(0,042/ V 200) = 0,824  0,0058 pol, ou 0,824 : 0,006 pol. 


(b) Os limites de confiança de 99% são: X 2,580 VN Ka 2,583 / V N = 
= 0,824 = 2,58(0,042/4200) = 0,824 “de 0,0077 pol. ou 0,824 4 0,008 pol. 

Note-se que se admitiu que « o desvio padrão registrado é o corrigido, 3. Se 
tivesse sido s, teríamos adotado $ = VÄIN - Ds “a/ 800] 99 s; 
considerado igual a spara t tôdas as finalidades práticas. Geralmente, para N É 30, 
pode-se admitir que s e $ são praticamente iguais, 


7. Determinar os limites de confiança de: (a) 98%; (b) 90%; 
(c) 99,73%, para o diâmetro médio dos rolamentos esféricos do 
Probl. 6. 


Solução: 


(a) Admita-se que z = ze soja tal que a área subtendida pela curva normal, 
à sua direita, é igual a 1%. Então, por simetria, à área à ssquerda de z = — Ze é 
também igual a 1%, de modo que a área sombreada é igual a 98% da total, 


Ze Ze 


Como a área total subtendida pela curva é iguala 1, 4 que está compreendida 
entre z = 0 e z = zç é igual s 0,49; em consequência, ze = 2,88. 
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Por isso, os limites de confiança de 98% são: X+ 2,8330) VN = =(1,824 + 
= 2,33.(0,0 2/4/300) = 0,824 =+ 0,0069 “pol. 


W Ho ejo-se o valor de ze para que a áres compreendida entre z = o e 
Zm Ze soja igusl a 0,45; então, ze = 1,045. 

Por isso, os limites de confisnga de 90% são: x + 1,6450/ VN = 0,824 + 

= 1,645 (0;042/4/200) = 0,824 + 0,0049 pol. 


de confiança de 99,73% são: É + 30//N = 0,8% + 


(e) Os -limites 
0,824 = 0,0089 pol. 


= 3 (0,0421200) 


8. Ao medir o tempo de reação, um psicologista avaliou que seu 
desvio padrão era de 0,05 segundo. Que extensão deve ser tomada 
para a amostra destinada às medições para que se esteja: (a) 95% 
e (b) 99% confiantes de que o êrro dessa estimativa não exceda a 
0,01 segundo ? ` 


Solução: G 


(a) Os limites de confiança de 95% são: Ñ + 1,960//N, sendo o êrro da 
estimativa de L960//N. Tomando-se g = s = 0,05 segundo, vê-se que o êrro 
será igual a 0,01 segundo, quando se verificar que (1,96) (0, 05y VN = 0,01, isto é, 
A/N = (1,96) (0,05)/0,01 = 9,8 ou N = 96,04. 

Por conseguinte, pode-se estar 95% confiantes de que o.êrro da estimativa 
será menor do que 0,01 quando N fôr igual a 97 ou maior. 


Outro método: 


VN (1,96) (0,05) 
SOO so Toa E Dr O VN a O 


(1,96) (0, 
VN 
Então, N = 96,04 ou N2 97. 


H 


= 9,8. 


(b) Os limites de confiança de 99% são: X+ 2,580/ VN. Então, (2,58) 
(0,05 VN = 0,01 ou N'= 166,4. Em conseqüência, poder-se-á estar 99% 
confiantes de que o êro da estimativa será menor do que 0,01, sômente quando N 
fôr igual a, 167 ou maior. 


a amostra aleatória de 50 graus em matemática, num total 
de 209, apresenta a média de 75 e o desvio padrão de 10. (a) Quais 
são os limites de confiança de 95%, para a estimativa da média dos 
200 graus? (b) Com que grau de confiança se diria que a média 
dos 200 graus é 75 + 1? f 


de: (a) 
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Solução: 

(u) Como o tamanho da população não é muito grande, em comparação 
com o tamanho da amostra, deve-se ajustá-los. Então, os limites de confiança 
de 95% são: 


P P E EA NeoN a 
X + 196% =X + 1,96 B Wai sgi 
5 z 1,96 ~> S10) 4) 200 — 60. = 75 + 2,4. 
n/50 Y 200 — 


(b) Os limites de confiança podem ser representados por: 
x = 40x =X tm 


= 76 + 1,23%0. 


Como êsse valor deve ser igual a 75 =: 1, tem-se 1,232 = 1 ou ge = 0,81, 
A área subtendida pela curva normal, entre z = 0 e z = 0,81, é 0,2910; por con- 
“seguinte, o grau de confiança desejado é 2(0,2910) = 0,582 ou 58,2%. 


Estimativas do intervalo de confiança das proporções 


10. O escrutínio realizado na amostra de 100 eleitores, escolhidos 


ao acaso entre todos os votantes de um determinado distrito, indicou ' 


que 55% dêles eram a favor de um certo candidato. Determinar, os 
limites de confiança de: (d) 95%; (b) 99%; (o) 99,78%, para a 
proporção de todos os votantes favoráveis àquele candidato. 


Solução: . 
(a) Os limites de confiança de 95%, para a população p, são: 


= Z 0,55 + "0,10, 


usando-se a proporção da amostra, P, como estimativa de p. 
(b) Os limites de confiança de 99%, para p, são: 
0,55 + 2,58 4/(0,55) (0,45)/100 = 0,55 = 0,13, 
“(c) Os limites de confiança de 99,73%, para p, são: 
0,55 + 3 (0,55) (0, 55) (0,45)/100 = 0,55 + 0,15. 
Para um método mais exato de resolução déste problema, veja o Probl. 12. 
il. Que dimensão deveria ter a amostra de eleitores do 


Probi. 10, p que o grau de confiança do candidato ser eleito fôsse 
e; $) 89,73%? 
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Solução: 


Os limites de confisnça de p são: P + Ze V pl — pN = 0,65 + z 
(0,55) (0,45)/N = 0,55 + 050 kai tendo-se adotado a estimativa P =p = 
= 0,55, com base no Probl 

Como o candidato Ha vencerá se receber mais de 50% dos votos da 
população, exige-se que 0,50 zd YN seja menor do que 0,05. 

(u) Para a confiança de 95%, 0,50 zA VN = 0,50 (1 96) VN = 0,05, quando 
N = 3842. Por conseguinte, N deveria ser, no mínimo, igual a 385. 


(b) Para a confiança de 99,73%, 9,50 z/ V N = 0,50 (3) VN = 0,05, quando 
N = 900. Em consegiiência, M deveria ser, no mínimo, igual a 901. 


Outro método: 


1,50/VN < 0,05, quando VN/1,50 > 1/0,05 ou VN > 1,50/0,05. Então, 
VN > 800u N > 900, de modo que N deveria ser, no mínimo, igual a 901 


(a) Se P é a proporção observada de sucessos em uma amos- 
tra de tamanho W, mostrar que os limites de confiança para a esti- 
mação da proporção de sucessos da população, p, com o nível de 

- confiança determinado por z,, são dados por: 


z2 POP, af 

O EENEN tam 
pe 7 Ty 
TN 


(b) Empregar a fórmula deduzida no item. (a) para obter os limites 
de confiança de 99,73%, do Probi, 10. 

(c) Mostrar que, para grande valor de N, a fórmula do item 
(a) reduz-se a p= P +z, V PO — PYN, utilizada no Probl. 10. 


Solução: 
(a) A proporção da amostra P, em unidades reduzidas = 


sro Pop, 
Po V= pN 


Os valores maior e menor desse variável reduzida são + Zz, em que ze 
determina o nível de confiança. Para ésses valores extremos, deve-se ter, portanto : 


P- p= £i Vpl — pyN. 
Elevando-se ambos os membros ao quadrado: 


P? — 2pP + p = z? p(1 — pyN. 


k 
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Multiplicando-se ambos os membros por N e simplificando, obtém-se: 
(N dzep — (2NP +e?) p + NP = 0. 
Fazendo-se a = N Le, b = — (NP +- ze) e c= NP? essa equação trans- 


forma-se em: ap? -H bp +c = 0, cuja solução, em relação a p, é dada pela fórmula: 


-ba VEZ dao  2NP tatt Vi ZAN Fe 
2a AN + a) 


2NP +22 t e VINPO-P) de 
AN + re) 


Dividindo o numerador e o denominador por 2N, a fórmula torna-se 


“(b) Para os limites de confiança de 99,73%, & = 3. Então, entrando-so 
com P = 0,55e X = 100, na fórmula deduzida no item (q), encontra-se p = 0,40 
e 0,69, que concorda com as soluções do Probl. 10(c). 

(e) Se o-valor de-N fôr grande, então.os-valores de-ze KIN) ze KAN Je ze fN ~- 
serão todos desprezivelmente pequenos'e poderão ser considerados nulos è, dessa 
forma, obter-se-á o resultado desejado. 


13. Em 40 lances de uma moeda foram obtidas 24 caras. De- 
terminar os limites de confiança de: (a) 95%; (b) 99,78%, para a 
proporção de caras que seria obtida em um número ilimitado de 
lances da moeda. 


Solução: 

(a) No nível de 95%, ze = 1,96. Entrando-se com P = 24/40 = 0,60 N = 40" 
na fórmula do Probl. 12), encontra-se p = 0,45 e 0,74. Em consequência, 
pode-se dizer, com 95% de confiança, que p está compreendido entre 0,45 e 0,74. 

Adotando-se a fórmula aproximada p = P d ze V PG — PYN, encontra-se 
p = 0,60 + 0,15, o que conduz nos intervalos de 0,45 a 0,75. 

(b) No nível 99,73%, z = 3. Adotando-se a fórmula do Probi. 124), 
encontra-se p = 0,37 e 0,79. 

Empregando-se a fórmula aproximada, p = P tz vB -— PIN, encon- 
tra-se p = 0,60 + 0,23, o que indica os intervalos de 0,37 a 0,83. 
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Imtervalgs de confiança das diferenças e somas 


14, Uia amostra de 150 lâmpadas elétricas, da marca A, apre- 
sentou a vida média de 1 400 horas e o desvio padrão de 120 horas. 
Uma amostra de 200 lâmpadas elétricas, da marca B, apresentou a 
vida média de 1200 horas e o desvio padrão de 80 horas. Deter- 
minar os limites de confiança de: (a) 95%; (b) 99%, para a diferença 
entre as vidas médias das populações das marcas 4 e B. 


Solução: 


Os limites de confiança de diferença entre as médias das marcas 4 e B são 
dados por: 
Fa — Xp dze Vo NA + o INB. 
(a) Os limites de confiança cd de 95% são: 


Em consegiiência, pode-se estar 95%. condiante de que a diferença entre as 
médias populacionais esteja compreendida entre 175 e 225 horas. 


(b) Os limites de confianga de 99% são: 


1400 — 1200 + 2,58 4(120)/150 + (80)/100 = 200 + 32,6. 


Por conseguinte, pode-se estar 99% confiante de que è diferença entre as 
médias populacionais esteja. compreendida entre 167 e 233 horas. 


15. Em uma amostra aleatória de 400 adultos e 600 adolescentes 


que assistem a certo programa de televisão, 100 adultos e 300 adoles- ° 


centes declararam que o apreciam. Determinar os limites de con- 
fiança de: (a) 95%; (b) 99%, para a diferença entre as proporções 
de todos os adultos e de todos os adolescentes que assistem ao pro- 
grama e o apreciam. 


Solução: 
Os limites de confiança das diferenças entre es proporções dos dois grupos 
são dados por: 


— Pi dese VN pa 


N 2; 


em que os índices 1 e 2 referem-se a adolescentes ea adultos, respectivamente, 
Neste casi Pi = 300/600 = 0,50 e Pz = 100/400 = 0,25 são, respectivamente, as 
proporgõeä dos adolescentes e dos adultos que gostam do programa. 


(a) Limites de confiança de 95%: 


0,50, = 0,25 == 1,98 5/(0,50) (0,50)/600 + (0,25) (0,75)/400 = 0,25 = 0,06. 
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Em conseqüêncie, pode-se estar 95% confiante de que a verdadeira diferença 


. entre as proporções esté compreendido entre 0,19 e 0 


(b) Limites de confiança de 99%: 


0,50 — 0,25 + 2,58 “66, 50) (0,50)/800 + (0,25) (0, 75)/400 = 0,25 s 0,08. 


Por conseguinte, pode-se estar 99% confiante dê que 2 verdadeira diferença 
entre as proporções está compreendida entre 0,17 e 0,83. 


16. A fòrça cletromotriz média das baterias produzidas por 
uma companhia é 45,1 volts e o desvio padrão 0,04 volt. Se 4 dessas 
baterias estão ligadas em série, determinar os limites de confiança 
de: (a) 95%; (b) 99%; (c) 99,73%; (d) 50%, para a fòrça eletro- 
motriz total. 


Solução: 
So Ey, E», Ese Eu representam as fòrças eletromotrizes das 4 baterias, tem-se: 


MEENE = PEL + PE, + RES BE © OEmEBE = 


= Vapè F opi + oes + OER 


Então, como ggi = MES = prs = pra = 45,1 volis e og = OR = CH E TE = 
= 0,04 volt, 


Reu Emas Ds = 35,1) = 180,4 6 aguy EzEg = VIOD)? = 0,08. 

ta) Os limites de confiança de 95% são: 180,4 = 1,96(0,08) = 180,4 = 0,30 volt: 
(b) Os limites de confiança de 99% são: 180,4 +: 2,58(0,08) = 180,4 zt: 6,21 volt, 
(c) Os limites de confiança de 99,78% são: 180,4 + 3(0,08) == 180,4 x: 0,24 volt. 
(d) Cs limites de confiança de 50% são: 180,4 =: 0,6745(0,08) = 180,4 + 0,054 volt. 


O valor 0,054 volt. é denominado êrro provável, 
intervalos de confiança dos desvios padrões 


17. O desvio padrão das durações de uma amostra de 200 lâm- 
padas elétricas foi calculado como 100 horas. Determinar os limites 
de confiança de: (a) 95%; (b) 99%, para o desvio padrão de tôdas 
essas lâmpadas elétricas. 


Solução: 


Os limites de confiança do desvio padrão populacional, q, são dados por 


a e o/V2N, em que ze indica o nível de confiança, Adota-se o desvio padrão 
da simostra como estimativa de g. 


(a) Os limites de confiança de 95% são: 300 + 1,960100) V T00 = 0 + 9,8. 


ESTATÍSTICA 


Dêsse modo, pode-se estar 95% confiante de que o desvio padrão da população 
está compreendido entre 80, 2 e 109,8. horas, 


“O Os limites de confisnça de 99% são: 100 +2 581004400 ; = 100 + 12,9. $ 


. Por conseguinte, pode-se estar 09% Sonens de que o desvio padrão da popu- 
lação está compreendido entre 87,1 e 112,9 horas. 


18. Que. dimensão deverá ser tomada, para a amostra: das 
lâmpadas elétricas do problema, anterior, para que se esteja 99,73% 
vonfiante de que o verdadeiro desvio padrão populacional não dife- 
rirá do da amostra de mais de: (a) 5%: (b) 10%? 


Solução: 


Os limites de confiança de 99,73%, para o, são: s + 30/V2N = s 3s/ 
N, adotando-se s como uma estimativa de c. Então, o êrro percentual do 


Iy. 
À 3s/V2N 
desvio padrão = SBV 2N E = 30 


(a). Se 300/V 2N = 5, N.= 1 800. Portanto, o tamanho da amostra deveria 
ser 1800 ou maior, 


Ch) Se 300 VIN = 10, N = 450. Em consegiiência, o tamanho da amostra 
deveria ser 450 ou maior. 


- Êrro provável. 


“:9. As voltagens de 50 baterias do mesmo tipo têm a média 
de 18,2 volts e o desvio padrão de 0,5 volt. Determinar: (a) o êrro 
provável da média; (b) os limites de confiança de 50%., 


Solução: 


(a) Erro provável da média = 


= 0,0745 — 
VN 


Observe-se que, so o desvio padrão de 0,5 volt fôr estimado como igual a 
$, o êrro provável é também de 0,6745 (0, 5/50) = 0,048, de modo que pode ser. 
adotada qualquer estimativa, quando N fôr suficientemente grande. 


== = 0,6745 (0,5/4/49) = 0,038 volt. 


(b) Os limites de confiança de 50% são: 18 4: 0,048 volt. 


20. Uma pesada foi regi 


strada como igual a 216,480 gramas, 
com o êrro provável de 0,272 grama. Quais são os limites de con- 
fiança de 95% para a pesada ? 
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Solução: 
a Erro provável = 0,272 = 0,674507 ou oF = 0,272/0,6745. ` 


Limites de confiança de 95% =X = 1,9607 = 216,480 + 1,96 (0,272/0,6745) =" 
= 216,480 + 0,790 grama. 


Problemas Suplementares 


Estimativas imparciais e eficientes 


21. Foram determinados os valores 8,3; 10,6; 9,7; 8,8; 10,2 e 9,4 quilos, 
respectivamente, para os pesos de uma amostra. Determinar as estimativas im- 
parciais e eficiente para: (a) a média populacional; (b) a variância populacional; 
(c) comparar o desvio padrão da amostra coni sua estimativa para a população, 


Resp: (a) 9,5 kg; (b) 0,74 kg; (c) 0,78 e 0,80 kg, respectivamente. 


22. Uma amostra de 10 váivulas de televisão produzidas por uma companhia 


“apresentou a vida média de 1 200 horas e o desvio padrão de 100 horas. Estimar: 


(a) a média; (b) o desvio padrão populacional de tôdas as válvulas produzidas 
pela companhia. 
Resp.: (a) 1200 horas; (b) 105,4 horas. 


23. (u) Resolver o Probl, 22, quando. os mesmos resultados forem obtidos 
em 30, 50 e 100 válvulas de televisão. (4) Que se pode concluir acérca da relação 
entre o desvio padrão da amostra e sua estimativa para a população, para dife- 


Resp.: (a) As estimativas dos desvios padrões da população, pára as amostras 
de tamanhos 30, 50 e 100 válvulas são, respectivamente, 101,7; 101,0 e 100,5 
horas. As estimativas das médias populacionais são iguais a 1200 horas, em 
todos os casos, 


Estimativas do intervalo de confiança das médias populacionais 


24, A média e o desvio padrão dəs cargas máximas suportadas por 60 cabos 
(veja o Probl, 59 do Capítulo 3) são dedos por 11,09 t e 0,73 t, respectiva- 
mente. Determinar os limites de confiança de: (a) 95%; (b) 20%, para a média das 
cargas. máximas de todos os cabos produzidos pela companhia, 

Resp.: (a) 11,09 + 0,18 t; (b) 11,09 + 0,24 t. 


25. A média e o desvio padrão dos diâmetros de uma amostra de 250 rebites 
fabricados por uma companhia 0,72642 e 0,00058 polegada, respecti- 
vamente (veja o Probi. 61 do Capítulo 3). Determinar os limites de con- 
fiança de: (a) 99%; (b) 98%; (c) 95%; (d) 90%, para a média dos diâmetros de 
todos os rebites fabricados pela companhia. . 

Resp.: (a) 0,72642 + 0,090095 polegada; (b) 0,72642 + 0,000085 pole- 
gada; (c) 0,72642 «+ 0,000072 polegada; (d) 0,72642 + 0,000060 polegada. 


PATÍBTICA 


tes de confiança de 50%; (b) o êrro provável, 
dous diârmetros do Probi. 25. 
(aj 0,72042 «+ 0,000025 polegada; (b) 0,000025 polegada. 


à estimado 
estivesse 
nativa, 


7. Se o desvio padrão das durações das válvulas de televisão 
em 100 horas, que tamanho de amostra deveria ser tomado para que 
contiante: (a) 95%:-(b) 90%; (e) 99%; (d) 99,73%, de que o êrro da 


da duração média não excede a 20 horas?” 


Risp: (a) pulo menos 96; (b) pelo menos 68; (c) pelo menos 167; (d) pelo 


menos 245. 


io 


28, Quais am os tamanhos das amostras do problema anterior, ee O 
êrro da estimativa ds duração médis não devesse exceder a 10 horas. 


Resp: (a) pelo menos 384 (b) pelo menos 271; (e) pelo menos 666; (d) 
pelo menos UU. 


29, Unu companhia tem 500 cabos. Um ensaio de 40 dêles, selecionados 
ao acaso, apresentei a tensão de ruptura média de 2 400 kg e o desvio padrão 
ge 150 kg: (a) quais são os limites de confiança de 95e 99%, para a avaliação 
da tensão de ruptura média dos 460 cabos remanescentes ? (b) com que grau de 
confianga se padori dizoc que a tensão de ruptura média dos 460 cabos re 
centes é de 23 Ra i 

Repi dns DADO 


E 2400 50 kg; (b) 870%. 


io 


3 Umam 


Estimatiyas intervalo de confiança das proporções 


t amtém ama proporção desconhecida de bolas de gude brancas 
e vermelhas, me amostra aleatória de 60 bolas, selecionadas com reposição 
na urna, &presenlon 70% de vermelhas. Determinar os limites de confiança de: 
o: (h ONG: (0) 90.73%. para a proporção real de bolas vertaelhas ne urna - 
esultados obtidos pelo emprêgo de ambas as fórmulas, à aproximada 
ta do Probl 12. É 

Resp ce) QTO LDB, 069 Ol; (W) 0,70 = 0,15, 0,68 0,15; (o) 
0,70 ct: 0,18. 047 + 0,17. 


KLD 


tomain para eque se e: 


à das bolas de gude do problema anterior deve- 
contiante: (2) 95%; (b) 99%; (c) 99,73% de 
ão difere da amostra de mais de 5%. 


Que tamanho da ams 


ri 


que a proporçio verdadeira 


“Be +: (e) pelo menos 323; (b) pelo menos 560; (e) pelo menos 756. 


32. Acredita-se que uma eleição apresentará. ums, diferença muito pequena. 
de votos entra dois carididatos. Qual é o número mínimo de eleitores favoráveis 
a um d es que assegure ume confiança de: (a) 80%; (b) 00%; (c) 95%; (d) 99% 
nã decisão » favor de um dos candidatos? 

E Resp: (a) 16 400; (b) 27 100; (c) 38420; (d) 66 600. 


Intervalos de confiança das diferenças e somas 


33. A dois grupos semelhantes de pacientes, 4 e B, constantes de 50 e 100 
indivíduos, respectivamente, for calos: a0 primeiro, um vôvo tipo de sopo- 


names" 
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$ rifero e, ao segundo, um ‘tipo usual. Pare os pacientes do grupo 4, o número 
É {médio de horas de sono foi de 7 ,82, com o desvio padrão de 0,24 hora. Para os 
pacientes do grupo B, o número médio de horas de sono foi de 6,75, com o desvio 
padrão de 0,30 hora. Determinar os limites de confiança de: (a) 95%; (b) 99%: 
para à diferença dos números médios de horas de sono produzido pelos dois tipos 
de” soporíferos. 

Resp: (a) 1,07 + 0,09 horas; (b) 1,07 + 0,12 horas. 


“34, Uma amostra de 200 parafusos produzidos por uma máquina apresentou 
15 defeituosos, enquanto que uma outra de 100, produzidos por outra máquina, 
apresentou 12 defeituosos. Determinar os limites de confiança de: (a) 95%; 
W) 99%; (o) 99,73%, para'a diferença das proporções das peças defeituosas pro- 
venientes des duas máguinas. Discutir os resultados obtidos. 

Resp.: (a) 0,045 = 0,073; (b) 0,045 + 0,097; (c) 0,045 0,112. 


35. Uma companhia fabrica rolamentos esféricos com o pêso raédio de 0,638 
libra e o desvio padrão de 0,012 libra. Determinar os limites de, confiança des, 
(a) 95%; (L) 99%, para os pesos de lotes constituídos de 100 rolamentos de osferas. 


Resp.: (a) 63,8 = 0,24 libras; (b) 63,8 = 0,31 libras. 


Intervalos de confiança dos desvios padiðes 


36. O desvio padrão das tensões de ruptura.de 100 cabos ensaiados por uma 
companhia foi de 180 kg. Determinar os limites de confiança de: (a) 95%; (b) 
99%; (c) 99,73%, para o desvio padrão de todos os cabos produzidos pela com- 
panhia. P E : 

Resp.: (a) 180 + 24,9 kg; (b) 180 + 32,8 kg; (c) 180 + 38,2 kg. 

%7. Determinar o êrro provável do desvio padrão do problema anterior. 

Resp: 8,6 kg. 

38. Que tamanho de amostra deve ser tomado para que se esteja confiante: 
(a) 95%; (b) 99%; (e) 99,73% de que q desvio padrão da população não diferirá 
do da amostra de mais de 2%? f 

Resp.: (a) pelo menos 4 802; (b) pelo menos 8321; (e) pelo menos 11 250. 


Caríruro 10 


TEORIA DA DECISÃO ESTATÍSTICA 
TESTES DE HIPÓTESES E SIGNIFICÂNCIA 


Decisões estatísticas 

Na prática, somos chamados com muita fregiência a tomar 
decisões acêrca de populações, baseadas nas informações das amos- 
tras, Essas decisões são denominadas estatísticas. Por exemplo, 
pode-se desejar decidir, com base em dados amostrais, se um nôvo 
-= sôro:6 realmente-eficaz na cura de uma doença, se um processo educa- 
cional é melhor do que outro, se uma certa moeda é viciada ete. 


Hipóteses estatísticas. Hipóteses nulas 


Ao tentar a fixação de decisões, é conveniente a formulação 
de hipóteses ou de conjeturas acêrea das populações interessadas. 
Essas suposições, que podem ser ou não verdadeiras, são denominadas 
hipóteses estatísticas o, em geral, consistem em considerações acêrca 
das distribuições de probabilidade das populações. 


Em alguns casos, formula-se uma hipótese estatística com o 


único propósito de vejeitá-la ou invyalidá-la. Por exemplo, se se deseja ` 


decidir se uma moeda, é viciada, formula-se a hipótese üe que ela não 
o seja, isto é,p = 0,5, em que p é a probabilidade de caras. De modo 
semelhante, se se deseja decidir se um processo é melhor do que 
outro, formula-se a hipótese de que não há diferença entre les (isto é, 
que quaisquer diferenças observadas sejam devidas meramente a 
flutuações das amostras provenientes da mesma população). Essas 
s são denominadas nulas e representadas por He. 
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Qualquer hipótese que difira de uma prefixada é denominada 
hipótese, alternativa. Por exemplo, se se admite que p = 0,5, são 
hipóteses alternativas: p = 0,7, p = 0,5 ou- p > 0,5. Uma hipótese 
alternátiva da nula é. representada por Mi. 


Testes de hipóteses e significância 


Admitida uma hipótese particular como verdadeira, se so veri- 
ficar que os resultados observados em uma amostra aleatória di- 
ferem acentuadamente dos esperados para aquela hipótese, com 
base na probabilidade simples mediante a utilização da teoria da 
amostragem, poder-se-á concluir que as diferenças observadas são 
significativas e ficar inclinados a rejeitar a hipótese (ou, pelo menos, 
a não aceitá-la com base nas provas obtidas). Por exemplo, se 20 
lances de uma moeda apresentam 16 caras, ficamos inclinados a 
rejeitar a hipótese de que a moeda é honesta, embora seja concebível 
que se esteja incorrendo em êrro, 


Os processos que habilitam a decidir se se aceitam ou rejeitam 
as hipóteses, ou a determinar se a amostra observada difere, de modo 
significativo, dos resultados esperados, são denominados testes de 


hipóteses ou de significância, ou regras de decisão. 


Erros do Tipo Ie H 


Se uma hipótese. fôr rejeitada quando deveria ser aceita, di 
que foi cometido um êrro do Tipo F. Se, por outro lado, fôr aceita 
uma hipótese que deveria ser rojeitada, diz-se que foi cometido um 
êrro do Tipo II. Em ambos os casos ocorreu uma decisão errada 
ou um êrro de julgamento. 


Para que quaisquer testes de hipóteses ou regras de dec 
sejam bons, êles devem ser Planejados de modo que os erros de de- 
cisão sejam reduzidos ao mínimo. Isso não é tarefa simples, porquanto 
para um dado tamanho de amostra, a tentativa de diminuir um 
certo tipo de êrro é acompanhada, em geral, pelo acréscimo de outro 
tipo. Na prática, um tipo de êrro pode ser mais importante do que 


- outro, de modo que se deve procurar uma acomodação que favoreça 


a limitação do êrro mais sério. O único caminho para a redução de 
ambos os tipos de erros consiste em aumentar 6 tamanho da amostra, 
o que pode ou não 
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Nível dey significância 


Ko) testar uma hipótese estabelecida; 8 y 
coma qual se sujeitaria a correr o risco de ùin êrro do Tipo 1 é deno- 
minada nível de significância do teste. Essa probabilidade, represen- 
toda freqientemente por «, é geralmente especificada antes da extra-, 
ção de quaisquer amostras, de modo que os resultados obtidos não 
influenciem a escolha. s 

Na prática, é usual a adoção de um nível de significância 0,05, 
ou 0,01, embora possam ser nsados outros valores. Se, por exemplo, 
é escolhido um nível de significância 0,05, ou 5%, no planejamento 
de um teste de hipótese, há então cêrea de 5 probabilidades, em 100, 
da hipótese ser rejeitada, quando deveria ser aceita, isto é, há uma 
confiança de cêrca de 95% de que se tome uma decisão acertada. 
Nesses casos, diz-se que a hipótese é rejeitada no nivel de signifi- 
cância 0,05, o que significa que a probabilidade de êrro seria de 9,05. 


Testes que envolvem a distribuição normal 


Para exemplificar as idéias acima apresentadas, admita-se que, 
sob uma certa hipótese, a distribuição amostral de uma estatística 
S é normal, com a média ug e o desvio padrão og. Então, a distribuição 
da variável reduzida (ou escore z), dado por z = (8 — usos é a dis- 
tribuição normal reduzida (com média O e variância 1) que está 
representada na Fig. 10-1. 


REGIÃO 
CRÍTICA 


Fig, 10-1 


Como está indicado na figura, pode-se estar 95 % confiante 
de que, se à hipótese fôr verdadeira, O escore z de uma estatística 
` amostral real, S, estará compreendido entje — 1,96 e 1,96 (visto que 
a área, subtendida pela curva normal, eni e êsses valores, é 0,95): 

Ehtretanto, se, ao escolher uma única amostra aleatória, veri- 
ficar-se que o escore z dessa estatística cai fora do intervalo de — 1,96 
a 1,96, concluir-se-ia que êsso evento poderia ocorrer com a probabi- 
lidadeide apenas 0,05: (área total sombreada nè figura) sc a hipótese 
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estabelecida fôsse verdadeira. Dir-se-ia, então, que êsse escore z 
„difere de modo significativo do que seria esperado daquela hipótese, 
e se estaria propenso a rejeitá-la, 

E área total sombreada, de 0,05, é o nível de significância do 
teste. Ela representa a probabilidade de incorrer-se em êrro na re- 
jeição da hipótese, isto é, a probabilidade de ser cometido um êrro 
do Tipo I. Por essa razão diz-se que a hipótese é rejeitada no nivel 
de significância 9,05, ou que o escore z da estatística amostral dada é 
significativo naquele nível. 

O conjunto dos escores 2, situados jora do intervalo de — 1,96 
a 1,96, constitui a denominada região ertbica, de rejeição da hipótese 
ou de significância. O conjunto dos escores 2, compreendidos no 
intervalo de -— 1,96 a 1,96 poderia, então, ser denominado região 
de aceitação da hipótese ou de não-significância. . 

Baseada nas observações acima, pode ser formulada a seguinte 
regra de decisão, teste de hipóteses ou significância. 

(a) Rejeição da hipótese no nível de significância 0,05, quando 
o escore z da estatística 8 situar-se fora do intervalo de — 1,96 à 
1,96 (isto é, z > 1,96 ou z < — 1,96). Isso equivale a dizer que & 
estatística amostral observada é significativa no nível 0,05. 

(b) Aceitação da hipótese (ou, se fôr desejado, não tomar ne- 
nhuma decisão) no caso contrário. 

Como o escore z representa papel tão importante nos testes de 
hipóteses e na significância, êle é também denominado teste esta- 
tistico. 

Deve-se assinalar que poderiam ser utilizados outros nfyeis de 
significância, Por exemplo, se fôr adotado o nível 0,01, substituir-so-á, 
em tôda & explanação anterior, 1,96 por 2,58 (veja a Tabela 10.1). 
A Tabela 9.1, pág. 260, pode também ser usada, porque a soma 
do nível de significância com o de confiança é igual a 100%. 


Testes unilaterais e bilaterais 


Nos testes acima, manifestou-se inierêsse nos valores extremos 
da estatística S, ou nos escores z correspondentes de ambos os lados - 
- da média, isto é, em ambas as “extremidades” da distribuição. Por 
testes são denominados bilaterais ou dos dois lados. 


Muitas vêzes, entretanto, pode-se ter interêsse apenas nos valo- 
res extremos de um mesmo lado da média, isto é, em uma “extre- 
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midade” da distribuição, como, por exemplo, quando se está tes- 


tando a hipótese de um processo ser melhor do que outro (o que é 
diferente de téstar so um. processo 'é melhor ou pior do que outro). 
Esses testes são denominados unilaterais ou de um lado. Nesses 
casos, a região crítica está situada dê um só lado da distribuição, e 
sua área é igual ao nível de significância. 

A Tabela 10.1, que dá os valores críticos de z para ambos os 
testes, unilateral e bilasoral, em vários s de significância, pode 
revelar-se útil como referência. Os valores críticos de z, para outros 
níveis de significância, são determinados mediante o emprêgo das 
tabelas de áreas da curva normal, 

Tabela 10.1 


Nível de significância a| 010 | 005 [ TE] 0,005 | 0,002 


fi 
— 2,58 | — 288 


Valores críticos de s ~ 1,28 | — 1,645 | = 2,33 
para testes unilaterais ou 1,28 | ou 1,645 | ou 2,23 


ou 2,58 | ou 2,88 


| ~ 2,81 | — 3,08 
le 2,81 e 3,08 


Valores críticos de = 
para testes bilaterais 


Testes especiais 


Para grandes amostras, as distribuições amostrais de várias 
estatísticas são normais-(ou; pelo menos, aproximadamente normais), 
- com média ug, e desvio padrão os. Nesses casos, podem ser utili- 
zados os resultados acima para formular regras de decisão ou testes 


de hipóteses e significância. Os casos especiais seguintes, tomados - 


da Tabela 8.1, pág. 239, são apenas algumas estatísticas de inte- 
rêsse prático. Em cada caso, os resultados prevalecem para popu- 
lações infinitas ou para amostragem com reposição. Para a amos- 
tragem sem reposição extraída, de populações fini 
devem ser modificados (veja a pág. 236). 


as, os resultados 
1. Médias. Neste caso, S = Xéa média amostral; ug = uy = 
= u é a média populacional; cg = oy = o) 


» em que o é o 
svio padrão populacional e N o tamanho da amostra. O escore z 
á dado por: 


d 


Quando fôr necessário, o desvio amostral, s ou 3, será adotado 
como a estimativa de o 


s 
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2. Proporções. Neste caso, S= P é a proporção de “sucessos” 
a proporção populacio- 


p, em que p é 


em uma amostra; Ma = Mp 


nal de sucessos e X 6 tâmianho da amostra; cg = op = “PIN, em 
queg = 1 — p. O escore z é dado por: 


P= p 


a 


No caso de P = Y/N, em que X é o número real de sucessos 


em uma amostra, o escore s- torna-se: 


V Np : 


isto é, uy=u=Npox=c=VNpeS=X. 


De modo semelhante podem ser obtidos os resultados para outras 
estatísticas. os 


Curvas características de operação. Potência de um teste 


Viu-se como o ĉrro de Tipo 1 pode ser adequadamente limitado, 
mediante a ««-olha de nível de significância, É possível evitar intei- 
ramente o risco de erros do “Tipo II, simplesmente pelo fato de não 
cometê-los, o que importa em nunes aceitar as hipóteses. Em muitos 
casos práticos, entretanto. isto não pode ser feito. Nesses casos, 
empregam-se frequentemente as curvas caracteristicas de operação 
ou curas CO, que são ficos que indicam as probabilidades de ` 
erros do Tipo IF, sob várias hipóteses. Elas proporcionam indica- 
ções de comia testes hem aplicados podem possibilitar à redução a0 
mínimo de erros do Tipo H, isto é, elas indicam a potência do teste, 
para evitar que sejam tomadas decisões erradas. São úteis no pla- 
nejamento de experiências, por mostrarem, por exemplo, que ta- 
manhos de amostras devem ser usados. 


r > 


Cartas de contrôle 
s importante saber quando um pro- 


chuente. de maneira que devem ser 
ses proble- 


Na práti. é muitas vêz 


remediar 4 situação. 


ponie a fhatuagãe: sionais ou a variaçõe 


do processo de fabricação, resultantes da avaria de alementos da 
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máquina, erros de empregados etc. Às carias de conirôle proporcio- 


nato, UM à método simples o útil para tratar dêsses problemas (veja o 


de tamanhos SWN. e w » retiradas das populações oiniivas d que têm 


as raédias pi è 23 6 os desvios padrões 0, e ga Considere-se a hipôtese 


nula de- yue. não há dijerença entre as médias populacionais, isto é, 
pa = jo, OU a de que as amostras são retiradas de duas populações 
que têm médias iguais. 

Fazendo ps = M: na Eq. (8) do Capítulo 8, pág. 237, vê-se que a 
distribuição amostral das diferenças entre as médias é aproximada- 
mente normal, com a média e o desvio padrão dados por: 


a e ez = (ei) + (e? 


a) 
em que podemos, se fôr se adotar os desvios padrões das 
amostras, $ © s lou 8,28 35), como estimativas 64 6 0» Usando-se 


as variáveis reduzidas, ou 08 escores z dados por: 


pode-se testar a hipótese wula em face A s alternativas (ou a signi- 
ficância de uma diferença observada), em um nível apropriado de 
S 


coporções 


Sejam P:i e Ps as proporções obtidas em duas grandes amostras, 
de Samanhos A e Ka retiradas das populações respectivas, que 


apresentam as proporções pı e pe Considere-se a hipótese nule de 
que não, há dijerença entre os parâmetros das populações, isto é, 


Pi = Ps, é dessa forma as âmost retiradas da mesma 


população. 


- Foiiendo-se pa capítulo 8, pág. 287, 
vê-se gue. a a distrib cas das proporções é 
aproxi jadamente normai, com a média e à desvio padrão dados por: 
“Bm =0 e sp-a S Vpl (3) 

Nit No 


em que p = é edotado como uma estimativa da 
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proporção populacional e q 


uzida 


Tsando-se a variável red 


(a) 


Tp- p 
jodem ser testadas as diferenças observadas, num nível apropriado 
> 


ignificância, e, por êsse meio, testar a hipótese nula. 
Semolhantemente, podem ser planejados os testes que envolvem 
outras estatísticas. 


de 


estes que envolvem a di uição binomial 

Os testes que envolvem a distribuição binomial, bem como as 
de outras espécies, podem ser planejados de modo análogo aos que 
se utilizam da distribuição normal, sendo os princípios básicos essene 
cialmente os mesmos (veja os Probls, 23 a 28), 


Problemas Resolvidos 


Testes de médias e proporções, usando distribuição normal 


1, Determinar a probabilidade de obter-se entre 40 e 60 caras, 
inclusive, em 100 lances de uma moeda honesta. 


Solução: 
De ecôrdo com & distribuição binomial, a probabilidade desejada é: 
CaO + rega E oe + CA. 


Como Np = 100$) o Ng = 100($) são ambos rasiores do que 5, pode-se 
empregar, pare o cálculo desse soma, o ajustamento da curva, normal à distribui- 


. são binomial, - 


Amédia e o desvio padrão dos números de caras, em 100 lances, são dados por: 
a= Np =100(}) = 50e s= VNp = VOOG) = 5. 

` Considerando-se a escala contínua, o intervalo entre 40 e 60 caras, inclusive, 
é o: mesmo que entre 39,5 o 60,5 caras. 

39,5 em unidades reduzidas = (39,5 — 50)/5 = — 2,10. 

-60,5 em unidades reduzidas = (60,5 — 50)5 2,10. 

Probabilidade desejada = áres subtendide pela curva normal entre # = 
= — 210 e g= 2,10 = 2 (área entre a = 0 e z= 2,10) = 2 (0,4821) = 0,9642. 


y 


r 


2. Para testar a hipótese de que uma moeda é honesta, adotou-se 
a seguinte regra de decisão: . 

(1) Aceitar a hipótese, se o número de caras, em um Única 
amostra de 100 lances, estiver entre 40 e 80, inclusive, 
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(2) Rejeitá-la em caso contrário. 

(a) Determinar a probabilidade de ser rejeitada a, hipótese, 
quando -ela fôr realmente correta. 

(b) Interpretar gráficamente a regra de decisão e o resuitado 
do item (a). 

(c) Que conclusões se poderiam tirar do fato de uma ex 
de 100 lances apresentar 53 caras? 60 caras? . 


(d) Poder-se-ia estar errado nas conclusões do item (e)? 


Solução: 

(a) De acôré, com o Prob), 1, a probabilidade de não se obter entre 
40 e 60 caras, inclusive, quando a moeda é honesta, é iguala 1 — 0,9642 = 0,0358. 
Então, à probabilidade da hipótese ser rejeitada quando ela é correta = 0,0353. 

(b) A regra de decisão é ilustrada pela Fig. 10-2, que mostra a distribuição 
de probabilidade das caras em 100 lances de uma moeda honesto. 

Se uma única amostrá de 100 lances resultar num escore z, compreendido 
entre — 2,10 e 2,10, aceitar-se-á a hipótese; no caso contrário, ela será rejeitada 
e decidir-se-á que a moeda é viciada. 


i 
i 


REGIÃO DE! "REGIÃO DE 
seção // SERO pe N cc pe 
A Bl 
z= 10 z=, : 
(39,5 caras) (60,5 caras) 
big. 10-2 


O êrro cometido ao rejeitar a hipótese, quando deveria ser aceita, é do Fipo £ 
da regra de decisão e a probabilidade de cometêlo é igual a 0,0358, conforme o 
item (a), e é representado pela área total sombreada da figura. 

Se eim uma única amostra de 100 lances ocorrer um número de caras, cujo 
escore z (ou estatística z) caja na região sombreada, dir-se-ia, que o escore z difere 
de maneira significativa do que seria esperado se a hipótese fôsse verdadeira, Por 
esta razão, a área total sombreada (isto é, a probabilidade de um êrro do Tipo 3) 
é denominada nível de significância da regra de decisão e é igual a 0,0358, neste 
caso. Portanto, fala-se em rejeição da hipótese no nível de significâncis. 0,0358 
ou 3,58%. 

(c) De acôrdo com a re 
ser honesta, em ambos os caso 


ra do de 
Podi 


o, deve-se aceitar a hipótese da moeda 
argumentar que, se apenas mais uma 


cara fôsse obtida, teríamos rejeitado a hipótese. Isso é o que se tem de enfréntar, . 


quando é utilizada uma linha tênue de divisão na tomada de decisões. 
(d) Sim. Poder-se-ia aceitar a hipótese quando deveria ser rejeitada, e êsse 
seria o caso, por exemplo, se a probabilidade de caras fôsse, realmente, de 0,7 
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em vez de 0,5. O ĉrro cometido ao aceitar a hipótese, quando deveria ser rejeitada, 
é do Tipo IX da decisão. Para ulterior desenvolvimento, veja os Probls. 10 a 12. 


3. Planejar uma regra de decisão para testar a hipótese de 
uma moeda ser honesta, quando é considerada uma amostra de 64. 
lances e é adotado o nível de significância: (a) 0,05; (b) 0,01. 


Solução: 


(a) Primeiro método; Se o nível de significância 60,05, cada área som- 
breada da Fig. 10-3 é de 0,025, por simetria, Então, a área entre Oe 2; = 0,5000 — 
— 0,0250 = 0,4750 e zı ="1,96. 


Então, uma regra de decisão possivel será: 

(1) Aceitar a hipótese de que a moeda é honesta quando z estiver compreen- 
dido entre — 1,960 1,96. 

(2) Rejeitá-la no cáso contrário. 


Nom 
2i 
Fig. 10-3 
Os valores críticos, — 1,96 e 1,96, Podem também ser retirados da Tabela 10. 1 
“Para expri regra do decis s do caras a sore btidas 


em 64 lances da moeda, note-se que a média e o desvio padrão da distribuição 

das caras são dados por: 

H ; 

para à hipótese do que a moeda é verdadeira. Então, z = (X -- pye =(X — 32)/4. 
Se z = 1,96, (X ~- 32)/4 = 1,96 ou X = 39,84. Se g = — 1,96, (X — 284 = 

= — 1,96 cu X. = 24,16. 


Portanto, a regre de decisão torna-se: 

(1) Aceitor a hipótese de que a moeda é honesta, quando-o número de caras 
estiver compreendido entre 24,16 e 39,84, isto é, entre 25 ¢ 39, inclusive. 

(2) Rejeitá-la, no caso contrário. 


Segundo método: Com a probabilidade de 0,95, o número de caras estará 
situado entro p — 1,960 c p + 1,960, isto é, Np — 190V Np e Np + 
+1,90 VNp, ou entre 32 — 1,96 (4) = 24,16 e 32 + 1,90 (4) = 39,84, o que 
couduz à regra do decisão acima. 

Terceiro metodo: — 1,96 < z < 1,96 é equivalente 2 — 1,90 < } (X <32) < 
<1,96. Então, — 1,96 (4) < (X — 32) < 1,96 (A, ou 32— 190 H) < X < 
<32 + 1,96 (4), isto é 2316 < X < 39,84, o que também conduz à mesma 
regra acima. 
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(b) Se o nivel de significância é 0,03, cada área sombreada da figura acima 
é 9,005.- Então, a área entre O e zı = 0,5000 ~ 0,0050 = 0,4950 e z; = 2,58 
{mais exstamente, 2,575). Éisse valor pode também ser tirado da Tabela 10.1. 

Adótsfido-se o processo do segundo método, para o item (a), vê-se que, com 
a probabilidade de 0,99, o número de caras estará situado entre u — 2,580 e 

- H + 2,080, isto é, 32 — 2,58(4) = 21,68 e 32 + 2,58(4) = 42,32. 

Em consequência, a regra de decisão torna-se: 

(1) Aceitar a hipótese, quando o número de: “caras estiver compreendido entre 
22 « 42, inclusive. 

(2) No caso contrário, rejeitá-la. 


4. Como se planejaria uma regra de decisão para o Probl. 3, a 
fim de evitar um tiro do Tipo I1? 


Solução: 

Comete-se um êrro do Tipo U quando se aceita uma hipótese que deveria ser 
rejeitada. Para evitá-lo, em vez de aceitar a hipótese, simplesmente não se a 
rejeita, o que pode significar que se está evitando qualquer decisão a respeito. 
Em consequência podemos, por exemplo, redigir a regra, de decisão, para o 
Probl. 3(b), da seguinte forma: 

(9) Não rejeitar a hipótese, quando o númsro de caras estiver compreendido 
entre 22 o 42, inclusive. 

(2) No caso contrário, rejeitá-la, 


Em muitos exemplos práticos, entretanto, é importante decidir se uma hipó- 
tese deverá ser aceita ou rejeitada. Um estudo completo dêsses casos exige a 
consideração dos erros do Tipo II (veja os Probls. 10 a 12). 


% Em uma experiência sôbre a percepção extra-sênsorial (P.E.S.) 
um indivíduo (sujeito), em uma sala, é solicitado a declarar a côr 
vermelha ou preta de uma carta escolhida, de um baralho bem em- 
baralhado de 50 cartas, por outro indivíduo colocado em outra sala. 
O sujeito desconhece quantas cartas vermelhas ou pretas há no ba- 
ralho. Se o sujeito identifica corretamente 32 cartas, determinar se 
os resultados são significativos, nos níveis de significância: (a) 0,05; 
(b) 0,01. 


Solução: 
Se p é a probabilidade do sujeito declarar corretamente a côr de uma carta, 
deve-se decidir, então, entre as duas hipóteses Seguintes: 


Ho: p = 0,5, e o sujeito está simplesmente«adivinhando, isto é, os resultados 
são” devidos ao acaso. 


Hx: p> 0,5, e o sujeito tem faculdades de PES. 


Escolhe-se um teste unilateral, visto que não há interêsse na aptidão de obter 
escores extremamente baixos mas, ao contrário, na de obter escores altos. . 
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Se a hipótese Ho fôr verdadeira, s média e o desvio padrão do número de 
cartas corretamente identificadas são dados por: 

u= Np = 500,5) = 25 e 0 = /Nig = 4/50(0,5) (0,5) = V T25 = 3,54. 

(a) Para um teste unilateral no nível de significância 0,05, deve-se escolher 
2, na Fig. 10-4, de modo que a área sombreada da região erítica dos escores altos 
seja 0,05. Então, a área entre 0 e zı = 0,4500 e zı = 1,045. Ésse valor pode tam- 
bém ser tirado da Tabela 10.1. 

Portanto, a regra de decisão ou teste de significância será: 

(1) Seo escore z observado fôr maior do que 1,645, os resultados serão signi- 
ficativos no nível 0,05, e o indivíduo tem faculdades de P.E.S. 

(2) Se o escore 2 fôr menor do que 1,645, os resultados são devidos no acaso, 
isto é, não serão significativos no nível 0,05. 


REGIÃO 
CRÍTICA 


i 


Fig. 10-4 


Como 32, em unidades reduzidas, é igual a (32 — 25)/3,54 = 1,98, superior 
a 1,645, e decisão (1) é válida, isto é, conelui-se que, no nível 0,05, o individuo 
tem faculdades de P.ES. á 

Note-se que, na realidade, aplicar-se-ia uma correção de continuidade, pôsto 
que 32, em uma escala contínua, está compreendido entre 31,5 e 32,5. Entretanto, 
81,5 tem um escore reduzido de (31, 5 — 25)/3,54 = 1,84 è, entio; chegar-se-ia à 
mesma conclusão. 

(b) Se o nível de significância é 0,01, então a área entre Oe zı = 0,4900 é 
1 = 2,33. Como 32 (ou 31,5), era unidades reduzidas, é 1,98 (ou 1,84), inferior 
a 2,33, conclui-se que os resultados não são significativos no nível 0,01, 

Alguns estatísticos adotam a seguinte terminologia: os resultados signifi- 
cativos no nível 0,01 são altamente significativos; os significativos no nível 0,05, 
mas não no 0,01, são provavelmente significativos; os resultados significativos ema 
níveis superiores & 0,05 são ndo-significativos. , 

De acôrdo com esta terminologia, concluir-se-ia que os resultados da expe- 
riència acima são provâvelmente significativos, de modo que se justificam investi- 
gêções ulteriores do fenômeno. 


Como os níveis de significância servem de guia para 3 tonadi de decisões, 
alguns estatísticos citam as probabilidades reais pertinentes. Por exemplo, neste 
problema, como Priz > 1,84} = 0,0322, ós estatísticos diriam que, buscados na 
experiência, as probabilidades de incidir em êro, ao concluir-se que o indivíduo 
tem faculdades de P.E.S é, aproximadamente, de 3em 100. A probabilidade citado, 
neste caso, 0,0322, é, às vêzes, denominado. nível de significância experimental 
ou descritiva. ` 
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6. O fabricante de uma droga medicinal reivindicou que ela 
era 90% eficaz em curar uma alergia, em um período de & horas. 
Em uma amostra. de: 200 pessoas que tinham alergia; a dròga curou 
160 pessoas. Determinar se a pretensão do fabricante é legítima. 

Solução: 

Soja p s probabilidade de obter-se a cura da sinis mediante o uso da droge, 
Então, deve-se decidir entre duas- hipóteses: 

Ho: p = 0,9, e a pretensão é correta. 

Hp < 0,9, eela & 

Escolhe-se um te: 
Proporção 


isa. 


z 


unilateral, porque não há interêsse em determinar se 4 
a curadas pela droga é muito baixa, 


de pe 


REGIÃO 
CRÍTICA 


Fig. 10-5 
Se o “nível de significância raoi e 0,01, isto é, se a área sombreada da 


Pig. 10-5 6 0,01, então zı = —'2,33, como se pode verificar, conforme o Probi. 


S(b), utilizando-se a simetria da curva ou a Tabela 10.1. Toma-se para regra de 
decisão: 


(1) A protonsão não será legítima quando 2'fôr inferior a — 2,33 (e, nesse 
caso, rojoite-so Mo). 


(2) No caso contrário, a pretensão será legítima e os resultados observados 
io devidos ao acaso (e, então, aceita-se Ho). 


Se da 6 H= Np = 200,9) = 180 e e =V Npa = N/200(0,9) (0,1) 


les reduzidas = (160 ~- 180)/4,23 = — 4,73, que é 
Portanto, de acórdo com a regra do decisão, conclui-se 
a e que os resultados da amostra são altamente signi- 
item final). 


& A vids média do uma amostra de 100 lâmpadas fluorescentes, 


produzidas por uma companhia, foi calculada em 1570 horas, com 
o desvio padrão de 120 horas. Seu é a vida média de é 3 as Jâm- 
padas produzidas pela companhia, testar a, hipótese u = 1606 horas, 
em fece dà hipótese alternativa u = 1600 horas, adotado o nível 
de significância: (a) 0,05; (b) 0,01. 

Solução: 


Deve-se decidir entro as duas hipóteses: 


Hoi u = 1600 horas. Ha: p >£ 1600 horas. 
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Deve-se empregar um teste bilateral neste caso, porque p =< 1600 inclui 
tanto os valores maiores como os menores do que 3600. 
(a) Para um, teste bilateral no nível de significância 0,05, há a seguinte 
ogra de decisão: 


4) Rejeitar Ho quando q escore z da média amostral estiver fora da inter- 
É ja 1,96. 
2) Aceitar Ho (ou não tomar nenhuma decisão), no caso contrário. 


istica considerada é à média amostral X. Sua distribuição amostral tem 
ue o desvio padrão 0X = oN, em que u e o são x médis e o 


companhia. 


a hipótese Ho, p = 


= 12, adotando- 
da amostra como uma estimativa para o. Camo z =(= 
70 — 1600)/12 = — 2,50 cai fora do intervalo >— 1,960 a 1,96, 
+ Yu no nível de sigoificância 0,05. - 


Se o nivel de 


cia é 0,01, 0 intervalo de — 1,96 1,90 da regra 
ão do item (a) é substituído pelo de — 2,58 a 2,58. Então, como o escore 
50 cai dentro d ntervalo, aceita-se Mo (ou deixa-se de tomar qual- 
ão), no nivel de significância 0,01. É 


z de — 
quer deu 

8. No Probl, 7, testar a hipótese u = 1000 horas em face 
da alternativa 4 < 1600 horas, adotado o nível de significância: 
(a) 0,05; (b) 0,01. 


* Solução: 


Deve-se decidir entre as duas hipóteses: 

Ho: p = 1600 horas. 

Hy u < 1600 horas. 

Neste caso, deve-se empregar um teste unilateral, sendo & figuro, correspon- 
dente idêntica à do Probl. 6, 


(a) Se o nível de significância é 0,05, a região sombreado da Fig. 10 
rea de 0,05 € encontra-se zı = — 1,645. Portanto, adote-se a regra de d 


3. 


(1) Rejeitar Ho quando z fôr inferior a — 1,6 
1) 


(2) Aceitar Ho (ou não tomar nenhuma decisão), no caso contrário. 
Tendo em vista que, como no Probl. F(a), o escore z 6 — 2,50, inferior & 
— 1,045, rejeita-se Ho no nível de significância 0,05. Note-se que 


idêntica à obtida no Probi F(a), em que fui empregado um teste bilateral. 


(b) Se o nível de significância é 0,01, o valor de x, na Pig. 10-5, é — 2,38. 
Em consegitência, adota-se a regra de decisão: 


(1) Rejeit tar He quando z fôr inferior a — 2,33. 


(2) Aceitar Ho (ou não tomar nenhuma decisão), no caso contrário. 
Dado que, como no Probl. 70), o escore g é — 2,50, inferior a poa 
rejeita-se Ho no nivel de significância 0,01. Note-so que es 


ma a que se chegou no Probl. 7(b), em que foi empre 


e bilateral, 
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Conclui-se que as decisões concernentes a ums determinada hipótese Ho, 
estes unilaterais e bilaterais, nem sempre concordar. 


mente deve ser esperado, visto “que Ho, em cada caso, é testada 
auma alternativa diferente. r 


tensão de ruptura dos cabos produzidos por um fabricante 
apresenta a média de 1800 kg e o desvio padrão de 100 kg. Mediante 
nova técnica no processo de fabricação, proclamou-se que a tensão 
de ruptura “pode ter aumentado. Para testar essa declaração, ensaiou-se 
uma amostra de 50 cabos, tendo-se determinado a tensão média de 
ruptura de 1850 kg. Pode-se confirmar a declaração no nível” de 
significância 0,01? 

Solução: 

Deve-se decidir entre as duas hipóteses: 

Ho: p = 1800kg e, nesse caso, não há realmente modificação da tensão 
de ruptura. E 

Hu u > 1809 kg e, então, há modificação daquele tensão. 

Deve-se, neste caso, empregar um teste unilateral. O diagrama relativo a 
éste teste é idêntico ao do Probl. 5 

No nível de significância 0,01, a regra de decisão será: 

(1). Se o escore z observado iôr superior a 2,33, os resultados serão signifi- 
cativos no nível 0,01, e Ho será rejeitada. ` 

(2) No caso contrário, Mo será aceita on a decisão ficará em suspensão. 
Para a hipótese de que Ho é verdadeira, determina-se: 

X- = 1850 — 1800 
To NT ooo T 

superior a 2,33. Conclui-se, portanto, que os resultados são altamente significa- 
tivos é & declaração é confirmada. 
Curvas características de operação 

10, Com referência ao. Probl. 2, qual é a probabilidade de 
aceitação da hipótese da moeda ser honesta, quando a probabilidade 
real de caras fôr p = 0,7? 

Solução: 

A hipótese Ho dé que a moeda é honesta, isto é, p = 0,5, é aceita quando o 
número descaras em 100 lances está compreendido entre 39,5 e 60,5. A probabi- 


P=07. 


- probabilidade de ser aceita a hipótese da mcede ser honesta, quendo p 
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lidade de rejeição de Ho, quando deveria ser aceita (isto é, à probabilidade de ser 
cometido um érro do Tipo 1) é representada pela área total da região sombreada. 


. subtendida pela curva normal à esquerda da Fig. 10-6. Como foi calculada no 


Probl. 2a), essa área «, que representa o nível de significância do teste de 
Ho, 6 igual e 0,0358. i 

. Se a probabilidade de caras fór de p = 0,7, então a distribuição. das caras 
nos 100 lances será representada pela curva normal à direita da Fig. 10.6. Nesse 
diagrama, é evidente que a probabilidade da aceitação de Ho, quando p fôr real- 
mente igual 2 0,7 (isto é, a probabilidade de ser cometido um êrro do Tipo 1, 
é dada pela área axurada 8 de figura. 

Para calcular essa área, observe-se que a distribuição, no caso da hipótese 

p = 0,7, tem a médis e o desvio padrão dados por: 


p = Np = (100) (0,7) = 70 e o = V Npa = V10MOI) (0,3) = 4,58. 
60,5 em unidades reduzidas-= (60,5 — 70)/4,58 = — 2,07. 
39,5 em unidades reduzidas = (39,8 — 70)/4,58 = — 6,66. 
Então, É E (área subtendida pela curva normal, entre z = — 6,666 4 = 
= — 2,07) = 0,0192. 
Em consequência, de acôrdo com a regra de decisão estabelecida, há uma pro~ 
babilidade muito pequena de ser aceita a hipótese da moeda ser honêsts, quando 


. p fôr realmente igual a 0,7. 


“Note-se que, neste problema, estabeleceu-se a regra de decisão e, de acórdo 
com ela, forax calculados a e 8. Na prática, duas outras possibilidades podem 
surgir: ` 

(1) Opter por um valor de œ (como 0,05 ou 0,01), chegar a uma regra de 
decisão e depois calcular o valor de 8. 

(2) Optar por valores de o e de B e depois chegar a uma regra de decisão. 


43. Resolver o problema anterior para: (a) p = 0,8; (b) p = 0,8; 
(o) p= 0,9; (d) p = 04. 
Solução: 
(a) Be p= 0,6, distribuição das caras tem a média e o desvio padrão dados 
por: 
u = Np = (100)(0,6) = 60 e e = 4/Npq = (100) (0,6) (0,4) = 4,90. 
60,5 em unidades reduzidas = (60,5 — 60)/4,90 = 0,0102. 
| 38,5 em unidades reduzidas = (89,5 — 80)/4,90 = — 4,18. 
` Então, 8 = (área subtendida pela: curva normal, entre 2 = 4,18 e z = 
= 60102) = 0,5040. 
- Por conseguinte, de acôrdo com à regra de decisão estabelecida, há uros grande 


tb) Se p = 0,8, então p = Np = (100) (0,8) = 80 e g = 4 
= 4/(106) (0,8) (0,2) = 
60,5 em unidades reduzidas = (60,5 — 80) = — 4,85. 
39,5 em unidades reduzidas = (39,5 ~- 80)/4 = — 10,12. 


ty 
© 
to 
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no TERÃO, B = (área subtendida pela curva normal entre z = — 10,12 e 
= — 4,88) = 0,0000, com suficiente aproximação. 
(e Da comparação . com (b), ou por meio de cálculo, verifica- -se que, pare 
p= 0,9, 8 = para tdas as qualidades práticas. 


(d) Por simetria, parà ? = 0, 4, obtém-se os mesmos valores de B que pari 
p = 0,6, isto 6 B = 0,5040. 


12. Representar grificamente os resultados dos Probls. 10 e 
11, mediante a construção de um gráfico de: (a) 8 em função de p; 
(b) (1 — B) em função de p. Interpretar os gráficos obtidos. 


Solução: 


A Tabela 10.2 apresenta os valores de B correspondentes aos dados a P, 
obtidos nos Probls, 10 € 11 


Tabela 10.2 


09 
POSEI 


0,5040 0,0192 | 0,0000 [oem 00 


o4 | o5 | 06 | 07 


0,5040 | 0,9642 


Note-se que 8 representa a probabilidade de aceitação da hipótese p = 0,5, 
quando p é realmente um valor diferente dêsse, Entretanto, se é realmente corto 
quê p =="0,5; pode-se interpretar 8 como a probabilidade de aceitação de ps 
quando éle deveria ser aceito, Essa probabilidade 6 iguala 1 — 0,0358 = 8 
e foi anotada na Tabela 10.2. 


A 1-8 
aw == 0,0338 Lo proa 
024 da 
og- og- 
0,7- o7- : 
o,s- 0,6 } 
0,5 +) os 
044) 0.44 
0,3) 0.3) 
0,2 024 
au J od 
E atin UITI REE 3 ARE aT q tem rr 
or o4 04 08 3 to 
(e) 


cap. 10 TEORIA. DA DECISÃO ESTATÍSTI 


“curva 


293 


(4) O gráfico de 8 em Tunção de p, apresentado na Fig. 10-7(0), é denorninado 
aeteristica ds operação, ou curea CO da regra de decisão ou do teste de 


hipótese. 
A distância do pouto máximo da curva CO A linha 8 = 1 Giguala œ = 0, 
cia do teste, 


e é o nível de signifi 


Em geral, quanto mais agudo fôr o pique da curva CO, w 


que não são vá 


, representado ni 
to ou do teste de hi 


emya y da CO, de modo 


lidade, 


úlicos são equivalentes, 


— B) é denominada junção de potência, porque ind 
riu de um teste, de re 


tar hipóteses nto é que dev 
s A quantidade 8 é também denominada função caracter 
de operação de um teste. 


13. Uma companhia fabrica cabos cujas tensões de ruptura 
têm a média de 300 kg è o desvio padrão de 24 kg. Acredita-se que, 
mediante um processe recentemente aperfeiçoado, a tensão média 
de ruptura pode ser aumentada. 


(ay Planejar uma regra de decisão para rejeição do processo 
antigo, no nível de significância 0,01, se foi resolvido submeter 64 
cabos a ensaio. 

(b) De acôrdo-coma-regra-de-decisão-adotada..em..(a),. qual é 
a probabilidade de aceitação do processo antigo, quando, de fato, o 
nôvo aumentou à tensão média de ruptura para 310 kg? Considerar 
que o desvio padrão é ainda de 24 kg. 


Solução: 


(e Seu Ga tensão média de ruptura, ja-se decidir entre as hipó 
Ho u = 300 kg, co nôvo processo é equivalente ao antigo. 


Hi: p > 300kg, ¢ o nóvo processo é melhor do que o antigo. 


ESTATÍSTICA 


(1) Rejeitar Ho, quando o escore z de tensão média de ruptura ds amostra 
a 2,38. A < . 


fòr 
No caso contrário, aceitar Ho. 


“Aê 


z AS = Ema Z = $00 +32- Então, se z > 2,33, X > 

> 300 + 3(2,33) = 307,0 kg. 

Em conseqüência, a regra de decisão lima torna-se: 

(1) Rejeitsr Ha quando è tensão média de ruptura dos 64 cabos exceder 2 
307 kg. 

(2) No caso contrário, soeitar Ha. 

(b) Considerem-se as duas hipóteses: 

Ho: u=300kge Hu u = 310kg. As distribuições das tensões médias de 
ruptura correspondentes às duas hipóteses estão representadas, respectivamente, 
pelas distribuições normais, à esquerda e.à direita, da Fig. 10-8 (ò). 


maons ip veio 80: 


7 SO 


Visto que z 


Fig. 10-8(0) 


A probabilidade de aceitação do processo antigo, quando a nova tensão média 
de ruptura é realmente de 310 kg, está representada pela região de área Bda 
Fig. 10-8(b). Para determiná-la, note qué 307 kg, em unidades reduzidas = (307 — 
— 3103 = — 1 Portanto: i 

B = (área subtendida pela curva normal da direita, à esquerdas de z = 
= — 1) = 0,1587. 

Esta será a probabilidade de aceitação de Ho: yp = 300 kg, quando, na. res- 
lidade, My: m = 310 kg fôr verdadeiro, isto é, & probabilidade de ser cometido 
um êrro do Tipo IL. 


14.º Construir uma curva: (a) CO; (b) de potência, para o Probi. 
13, admitindo-se que o desvio padrão das tensões de ruptura perma- 
nece igual a 24 kg. 


Solução: 

Por meio de raciocínio semelhante ao empregado no Probi. 130), deter- 
minain-se ös valores de B para os casos em que o nôvo processo proporcionar às 
tensões, médias de ruptura, 4, igusia a 305 kg,:315 kg ete, Por exemplo, se # = 
= 305 kg, então: 307 kg em unidades réduzidas = (307 — 305)/3 = 0,67, © por- 
tanto: é ai 

Å = (área subtendida pela curva normal da direita, à esquerda de z = 0,67) = 


“de p ser igual a 0,5), por meio de certo número de lances, dese; 


de 0,5 de 0,1 ou mais (isto é, para p 3 06 ou p S 
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Desta maneira, obtém-se a Tabele 10.3. 


Tabela 10.3 


E E di 
p 290 295 300 305 310 315 320 


B 1,0000 0,0038 | 0,0000 


1,0000 | 0,9900 | 0,7486 | 0,1587 


ta) A curva CO está representada na Fig. 10-90). Vê-se, nessa curvo, que 
a probabilidade de conservar o processo antigo, quando & nova tensão de füptara 
fôr inferior a 300 kg, será praticamente igual a 1 (exceto para o nível de signifi- 
cância 0,01, quando o nôvo processo dá a médis de 300 kg). Depois, esse probas 
bilidade cai quase verticalmente. para zero, de modo que não há, praticamente 
nenhuma probabilidade de ser conservado o processo antigo, ando a tensão mé- 
dia de ruptura fôr superior a 315 kg. 3 i j 


B 
1,0 a= 0,01 


k a = 0,01 
200 205 300 205 3i0 315 320 290 - 298 BN “os slo 31s 320 
(a) 46) 
Fig. 10-9 


. Mas é curva de potência, representada na Fig. 10-9(b), é suscetível de ser 
interpretada exatamente da mesma maneira que a CO. Def š 

A à ato, as d ata 
são realmente equivalentes. P AEE 


15. Para testar a hipótese de uma moeda ser honesta (isto é, 


impor as seguintes restrições: (4) a probabilidade de rejeição da 

hipótese, quando fôr verdadeira, deve ser, no máximo, de 0,05; (8) a 
) e, verd: i > ; 

probabilidade de aceitação da hipótese, quando p realmexite diferir 


m k i 0,4) deve ser de 
) 5, no máximo. Determinar o tamanho mínimo de amostra neces- 
sário e estabelecer a regra de decisão resultante. i 
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Solução: 

Neste caso, estabelecem-se limites para os riscos de serem cometidos erros 
dg Tipo Le do Tipo IL.. Por exemplo, s restrição imposta. em (4) exige que a pro- 
babilidado de um érro do Tipo Leeja igual a « = 0,05, no máximo, enquanto que 


a restrição (B) exige que s de um êrro do Tipo II seje, no máximo, É = 0,05. A ` à 


situação está ilustrada graficamente na Fig. 10-10. 


` p03 2=05 


Fig. 10-10 


Seje N o tamanho da amostra desejada e X o número de csras em N lances, 
acima do qual será rejeitada a hipótese p = 0,5. De acôrdo com a Fig. 10-10: 

(1) Ares subtendida pele curve normal p = 0,5, è direita de 

XK-Np  X-05N  X-05N 40025, 
VNp V NOSOS)  05VN 
(2) Área eubtendida pela curva normal p = 0,6, à esquerda de 
X-Np  X-06N O H-08N « 0,05. 
VNpa VNO6)(04)  0,49/N 
(Realmente, a área entre (X — 0,6N)/0,49V N e (N = X) — 0,6N)/049/N é 
0,05; (2) é uma boa aproximação.) 
da abria Ré X = 05N. 
De (1), eee me 1,96 ou (3) X =  0,5N + 0,980 VN. 
05 VN 

X — 0,6N 
049VN f 

Então, de (3) e (4), N = 318,98. Segue-se que o tamanho da amostra deve 
ser, no mínimo, igual a 319, isto é, deve-se lançar a moeda pelo menos 319 vêzes. 
Fezendo-se N = 319 em (3) ou (4), X = 177. - 

Pera p = 0,5, X-— Np = 177 — 159,5 = 17,5. Em consegiiência, adota-se 
B seguinte regra de decisão: 


De (2), = — 1,645 ou (4) X = 0,6N — 0,806 VN. 


(a) Aceitar a hipótese p = 0,5, quando o número de caras, em 319 lances, 
estiver compreendido no intervalo 159,5 + 17,5, isto é, entre 142 e 177 cares. 
(b) Caso contrário, rejeitá-la. 


Cartas de contrôle 


16. Construiu-se uma máquina para produzir mancais de 
esfera que têm o diâmetro médio de 0,574 polegada e o desvio padrão 
de 0,008 polegada. Para determinar se a máquina. está funcionando 
adequadamente, é retirada uma amostra de 6 mancais cada 2 horas, 
por exemplo, e é calculado o diâmetro médio ds amostra. 
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(a) Planejar uma regra de decisão, por meio da qual se poderá 


_ ter suficiente certeza de que a qualidade dos produtos está de acôrdo 


com as normas êxigidas. 
@) Mostrar como pode 'ser representada graficamente a regra 
de decisão do item (0). 

Solução: E 

(ay Com um grau de confiança de 99,73%, pode-se dizer que a média amos- 
tral X deve ester compreendida no intervälo entre (HĒ — 30%) e (RE Ei 30%), ou 
entre (yu — 30/VN) e (u + 3a VN). Como p = 0,574, o = 0,008 e N = 6, segue-se 
que para aquéle grau de confiança, a médio, amostral deve ester «iinprecndidê 
entre (0,574 — O, 024/6) e (0,574 + 0,024/ V5), ou entre 0,564 e 0,584 polegads. 
Portanto, 2 regra de decisão será a seguinte: 

(1) Se a médis amostral cair no intervalo entre 0,564 e 0,584 polegada, 
edmitir-se-é que a máquina está em funcionamento normal. 

(2) "No caso contrário, concluir-se-á que seu funcionamento é irregular e será 
preciso pesquisar a causa, 

(b) Pode ser mantido um registro das médias amostrais por meio de uma 
carta como 8 spresentada na Fig. 10-11, denominada caria de contrôle de quali- 
dade. Cada vez que fôr calculada uma média amostral, ela gerá representada por 
um ponto particular. Enquanto êles cairem entre o limite inferior, 0,564 pole- 
geda, e o superior, 0,584 polegada, o processo está sob contrôle. Quando um 
ponio fôr para fora dêsses limites de contrôle (como ocorreu com a terceira amostra 
tomada na quarta-feira), há a possibilidade de haver alguma coisa errada, © que 
justifica umea investigação. 


ppa 
Segunda-feira Terça-feira Quortafolra Quinta-feira Sextafairo 


Médio omestrol (era) 


RE Ene] q TEE, 
Fig. 19-11 


Os limites de contrôle acima especificados são denominados limites de con- 
fiança de 99,73% ou, abreviadamente, os limites de 30. Entretanto, podem ser 
também determinados outros limites de confiança, como os de- 09% ou 95%. 
A escolhê, em cade caso, depende de circunstâncias particulares. 


298 107 i i ESTATÍSTICA 


Testes que envolvem diferença de médias e de proporções 


C. 17} *Examinaram-se duas classes constituídas de 4G e de 50- 


respectivamente. Na primeira, O “grau médio foi 74, com o 
desvio padrão 8, enquanto que, na segunda, a média foi 78, com o 
destio padrão 7. Há uma diferença significativa entre os aproveita- 
mentos das duas classes, no nível de significância: (a) 0,05; .(b) 0,01? 


Solução: 

Suponha-se que as duas classes provêm de populações, cujas médias respec- 
tivas são me go Então, deve-se decidir entre as hipóteses: 

Ho: ty = |, e & diferença 6 meramente devide ao acaso. 

< Hy u pa © há uma diferença significativa entre ss classes. 

Para a hipótese Ho, as duas classes provêm da mesma população. A média 
e o desvio padrão da diferença das médias são dados por: 

um-m=0 e ox = COINA oN = VSO + 7150 = 1,606, 
em que se consideram os desvios padrões das amostras como as estimativas de 
ee ou # 

Então, z= (Xi — X) / oF- y; = (74 — 78)/1,606 = — 2,49. 


(a) Para um teste bilateral, og resultados serão significativos no nivel 0,05 
quando z estiver fora do intervalo de — 1;96 a 1,96. Portanto, conclui-se que, 
no nível de. 0,05, há uma diferença significativa entre os aproveitamentos das 
duas classes e que a segunda é, provavelmente, a melhor. 

(b) Para um testó bilateral, og resultados serão significativos no nível 0,01, 
quando z estiver fora do intervalo de — 2,58 a 2,58. Em consequência, conclui-se 
que, no nível de significância 0,01, não há diferença significativa entre as classes, 


Visto que os resultados são significativos no nível 0,05, mes não o são no 
0,01, conclui-se que os resultados são provâvelmente significativos, de acôrdo com 
a terminologia adotada na parte final do Probl, 5. A 


18. A altura média de 50 estudantes do sexo masculino, que 
tiveram. participação superior à média nas atividades atléticas cole- 
giais, era de. 173,23 cm com o desvio padrão de $,35'em, enquanto 
que os 50 que não mostraram nenhum interêsse nessas atividades 
“apresentaram a altura média de 171,45 em, com o desvio padrão 
de Zilem. Testar a hipótese dos estudantes do sexo masculino 
que “participaram de atividades atléticas serem mais altos do que 
-0s ousrós, E 


Deve-se decidir entre as hipóteses: 
Ho: m = pn não há diferença entre as alturas médias. 
Hu > Ha a altura média do 1º grupo é maior do que a do segundo. 
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Para a hipótese Ho: 

ms Ae ARKAS e x = VAA + aPN = V (2,57150 + (2,8750 = 0,53 
em que se considersram os desvios padrões des amostras como estimativas de 
G3 € Tu E 

Então: z= (Ži — Foie g, = F, = (173,28 — 171,45)/1,35 = 1,32. 
.. Com base em um teste unilateral, no nível de significância 0,05, a hipótese 
Ho serie rejeitada quando o escore z fôsse superior a 1,645. Por isso, não pode ser 
rejeitado. nesse nível. i 


Deve-se assinalar, entretanto, que a hipóteso pode ser rejeitada no nível 
0,10, se- se estiver propenso a assumir o risco de errar com 2 probabilidade de 0,10, 
isto é, de uma probabilidade em 10, 


19. De quanto deveria ser aumentado o tamanho da amostra . 
de cada um dos dois grupos do Probl, [18, para que a diferença 
observada, de 1,78 em, entre as alturas médias, seja significativa no 
nível de significância: (a) 0,05; (b). 0,01? 

Solução: 

Admita-se que o tamanho da amostra de cada grupo é N a que os desvios 
padrões dos dois grupos permaneçam 08 Mesmos, Então, para a hipótese Ho, 
ERnXo TO e 

iZ,- Ea” VORIN FOMIN = 25? + (BPN = V15,09/N, = 8,75/V N. 

Para uma diferença observada de 1,78em entre as alturas médias: 

Xi -F = 178 a LI8VN, 
o XX 95UVN. 953 

(a) A diferença observada será significativa, no nível 0,05, quando 

1,78 N/9,53 m 1,645, no mínimo, de módo que N deve ser: 78, no mínimo. 


Em conseguência, a amostra deve eer aumentada, em cada grupo, de 
(78 — 50) = 28, no mínimo. 


Outro método: 

LIYN E E 

“953 2 1,645; VN > (9,53X1,645)/1,78; VN Z 88; N Z 77,400 N E 78 

(b) A diferença observada será significativa, no nivėl 0,01, quando 
178 N/9,53 3 2,33; VN 2 (9,53) (2.831,78; VN = 12,5;N 2 15630uN 2 157. 

Portanto, o tamanho da amostra deve ser aumentado, em cada grupo, de. 
(157 —50) = 107, nó mínimo. 


zm 


20. Dois grupos, 4 e B, são formados, cada um de 100 pessoas 
que têm a mesma enferínidade. É ministrado um sôro aò grupo 4, 
mas não so B (denominado grupo de contrôle); a todos os outros res- 
peitos, os dois grupos são tratados de modo idêntico. Determinou-se 
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que 75 e 65 pessoas dos grupos 4 e B, respectivamente, curaram-se 
da enfermidade. Testar a hipótese do sôro auxiliar a cura da. enfer- 
midade, adotado o nível de significância: (a) 6,01; (b) 9,05; (c) 0,10. 


Solução: . 

Sejam. pı e po respectivamente, as proporções populacionais curadas {) 
mediante o ugo do sôro (2) sem o uso do sôro. Deve-se decidir entre as duas hi- 
póteses: 


Ho: pı = pa, e as diferenças observades são devidas 20 acaso, isto é, o sôro 
não é eficaz. 


Hi: pi > pe o sro é eficaz. 
-Para a hipótese Ko: 
HP- Ps = 0e oP- p= Vp INi + 1/N2) = (0,70) (0,30) (1/100 + 1/100) = 
= 0,0648, 
em que foi adotada, para & estimativa de p, 2 proporção média de curas nos dois 
grupos da amostra, dada por (75 + 05)/200 = 0,70, sendo q = 1 — p ='0,30. 
Então, e = (P1 ~ Pajopi— Pz = (0,759 — 0,650)/0,0648 = 1,54. 


(a) Com base em um teste unilateral, no nível de significância 0,01, rejei- 


tar-se-ia à hipótese Ho sômente quando o escore z iôsse superior a 2,33. Como o” 


escore z é apenas 1,54, deve-se concluir que os resultados são devidos ao acaso, 
nesse nível de significância. 

(b) Com base em um teste unilateral, no nível de significância 0,05, rejei- 
tar-se-ia Ho sômente quando o escore z fôsse superior a 1,645. Por isso, deve-se 

` concluir que os resultados também são devidos ao acaso, nesse nível. 

(c) Se fôr empregado um teste unilateral, -no nível de significância 0,10, 
rejeitar-se-ia, Ho sômente quando o encore z fôsss superior 2 1,28. Como esse con- 
digão foi satisfeita, concluir-se-á que o sôro é eficaz, no nível de significâncis, 6,10, 

Note-se que as conclusões scime dependeram de quanto ze estaria propenso 
2 correr o risco de érro. Se os resultados são realmente devidos 20 acaso, e 4º 
conclui que êles são resultantes do sro (êrro do Tipo J), poder-se-ia. continuar 
administrando o sóro a grupos nisiores de pessoas, apenas para verificar depois 
que êle é realmente ineficaz. Ésse é um êrro que ném sempre se estará, disposto 
* correr. 

Por outro lado, poder-se-is conchuir que o sóro não é efiesz; quando na res- 
lidade êle o €(êrro do Tipo II). Essa conclusão é muito perigosa, principalmente 
quando há vidas humanas em risco, 


21, Resolver o problema anterior quando cada grupo fôr com- , 


posto de 300 pessoas e se forem curadas 225 do grupo 4 e 195 do B. 


Solução: 

Note-se que, neste caso, 88 proporções de pessoas curadas nos dois grupos 
são 225/300 = 0,750 e 195/300 = 0,650, respectivamente, iguais às do problems 
precedente. Para a hipótese Ho: 


Eg: 
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Ep- p: 7 Dep P= V paN: + HN?) = V0,70) (0,30)(1/300 -+ 1/300) = 
= 0,0374, em que (225 + 195)/600 = 0,70 é usado como uma estimativa. dep. 
- Então, 2 =(Py = Pojop, py = (0,750 — 0,650)/0, 0374 = 2,67. 


Como êsse valor de z é superior a 2,33, pode-se rejeitar a hipótese, no nível 
de significância 0,01, isto é, pode-se concluir que o sôro é eficaz, com uma pro- 
habilidade de apenas 0,01. 

Jeso mostra como o acréscimo de tamanho da amostra pode aumentar & con- 
fiança nas decisões. Em muitos casos, entretanto, pode ser impraticável o aer 
cimo de tamanho da amostra. Em tais casos. somos forçados a tomar decisões 
com base nas informações disponíveis e, dessa forma, deve-se argumentar com 
grandes riscos de decisões incorretas. 


22. Um inquérito amostral, entre 300 eleitores do distrito 4 
e 200 do distrito B, indicou que 56 e 48%, respectivamente, foram 
a favor de um certo candidato. No nível de significância 0,05, testar a 
hipótese de: (a) haver uma diferença entre os distritos; (b) o can- 
didato ser preferido no distrito 4. 


Solução: 

Sejam pı e pz ss proporções de todos os eleitores dos aistri, AeB, respecti- 
vamente, favoráveis ao candidato. 

Para a hipótese Ho: pı = pz tem-se: 
Bpi- pa = 06 Op,- pa = /PIGINA + UNO) = (0,528) (0,472) (1/800 + 1/200) = 
= 0,0456, ëm que edoteram coio estimativas de p é q 08 valores [(0,56) (300) + 
-+ (0,48) (200)]/500 = 0,528 e (1 — 0,528) = 0,472, 

Então, 2 = (P — Po)Jopç- py = (0,560 — 0,480)/0,0456 = 1,75, 

(a) Se se deseja apenas determinar se há uma diferença entre os distritos, 


deve-se decidir entre as hipóteses (Ho: pı = pz) € (Hu pi =é p), O que envolve 
um teste bilateral. 


Com base em um teste bilateral, no nível de significância 0,05, pius 
Ho quando z estiver fora do intervalo de — 1,96 a 1,96. Como 2 = 1,75 fica dentro 
dêsse intervalo, não se pode rejeitar Ho nesse nível, isto é, não há diferença signi- 
ficativa entre os distritos, 

. (b) Se se deseja determinar se o candidato é preferido no distrito 4, deve-se 
decidir entre as hipóteses (Ho: pı = pa) e (Hi: pi > pz), O que envolve um teste 
unilateral. 

Com base em um teste unilateral, no nível de significância 0,05, rejeitar-se-ia 
Ho quando z fósse superior a 1,645. Como êsse é o caso, pode-se rejeitar Ho, nesse 
nível, e concluir que o candidato é proferido no distrito A. 


Testes que envolvem distribuições binomiais 


23. Um instrutor dá um questionário rápido, constante de 10 
questões do tipo certo-errado. Para testar a hipótese do estudante 
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estar adivinhando, adota-se a seguinte regra de decisão: (i) se 7 
„ou mais estão corretas, o estudante não está adivinhando; (ii) se 
e 7 estão corretas, o estudante está adivinhando. Deter- 
mihar'à probabilidade de rejeição da hipótese, quando ela é correta. 


Solução: 
Seja pa probabilidade de uma questão ser respondida corretamente. A pro- 
babilidade -da obtenção de X problemas entre 10 corretos é: 
5 1Cxp¥g 0X, em que q = 1 — p. 
Então, para a hipótese p = 0,5 (isto é, o estudante está adivinhando): 
Pr(7 ou mais certos) =Pr(7 certos) + Pr(8 certos} + Pr{9 certos] + 
7 + Pr{ JÖ certos} = 


= 200 HAYES + CLG + 003) + 
+ oCaolh)® = 0,1719. 
Portanto, s probabilidade de concluir que o estudante não está adivinhan- 


do, quando realmente o está, é 0, 1719. Note-se que essa éa probabilidade de um 
êrro do Tipo E. 


- 24. No problema anterior, determinar a probabilidade de gcei- 
tação da hipótese p = 0,5, quando reslmente p = 0,7. 


Solução: 

Para a hipótese p = 0,7: 

Pilpan dè 7 certos} = 1 — Pr{7 ou mais certos} = 
= 4 — [oCXL0,7)X0,3) + 10C8(0,7)%(0,3} + 
+ 19C9(0,7)(0,3) + 10C10(0,3)] = 0,3504. 


25.. No Probl. 23, determinar a probabilidade de aceitação 
da hipótese p= 0,5, quando realmente: (a) p = 0,8; (ò) p = 0,8; 
()p=0,9; (d) p = 0,4; (e) p =0,3; (f) p = 0,2; (9) p = 0,1. 


Solução: 


(a) Se p = 0,8, 8 + probabilidade desejada = 


= 1 — [Pr{7 certos) + Pr{8 certos] + Pr{9 certos] + 
-+ Pr{10 certos)] = 
= 1 — [10070,6¥(0,4} + C80, 6 (0,4)? + 209(0,6)%0,4) + 
+ 19C1(0,6)] = 0,618. 
Os Fesultados para os itens (b), (c), ... (g) podem ser encontrados de maneira 
"semelhante e estão indicados na Tabela 10.4, juntamente com os valores corres- 
pondentes a p = 0,6 e p = 0,7. Note-se que a probabilidade é representada por 
8 (probabilidade de um êro do Tipo II). Também estão incluídos os valores 
para p = 0,5, dado por 8 = 1 — 0,1719 = 0,828, de acôrdo com o Probl. 23, 
0,7, calculado no Probl. 24, 
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o E 0,8 | oz | 0,8 
8 | 1,000 cam | om | 0,013 


26. Utilizar os resultados do Probl. 25 para construir um 
gráfico de B em função de p e obter, portanto, a curva característica 
de operação da regra de decisão do Probl. 23. 


Tabela 10.4 


o2 | 03 | 04 | 05 2,9 


0,618 


0,999 E 0,945 | 0,828 


Solução: 

O gráfico desejado está representado na Pig. 10-12. Observe-se a seme- 
lhança com a curva CO do Probl. 14. 

Se os valores de (1 — 8) fôssem locados em função de p, obter-se-ia a curva 
de potência da regra de. decisão. 

O gráfico indica que & regra de decisão estabelecida é eficaz para a rejeição 
de p= 0,5, quando na realidade p £040u p 508. 


o T T TT T T a a 4 
0,2 0,4 0,6 0,8 1,0 
Fig. 10-12 


27. Lança-se uma moeda 6 vêzes e aparece cara em tôdas as 6. 


Pode-se coneluir, nos níveis de significância: (a) 0,05; (b) 0,01, que a 


moeda é viciada? Considerar ambós os testes, uni e bilateral. 
Solução: 
Seja p a probabilidade de surgir cara em um lance único da moeda. Para 


-a hipótese Ho: p = 0,5 (isto é, a moeda é honesta): 
- p(X) = Pri X caras em 6 lances! = Cx GGS X = 0Cx/64. 
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Então, as probabilidades de surgirem Q, 1, 2, 3, 4, 5 e 6 caras são dadas, 


respectivamente, por 1/64, 6/64, 15/64, 20/64, 15/64, 6/64 e Iot, como está indicado 


graficamente na distribuição de probabilidade da Fig. 10-13. 


Teste unilateral: 


Neste caso, deseja-se decidir entre as hipóteses (Ho: Pp = 0,5) e (Hi: p>0,5. 


Como Prf6 caras} = 1/64, = 0,01562 e Pri5 ou 6 caras} = 6/64 + 1/64 = 
= 0,1094, pode-se rejeitar Ho, no nível 0,05, mas não no 0,02 (isto é, o resultado 
observado é significativo no nível 0,05 mas não no 0,01). 


P(X) 


Fig. 10-15 


Teste bilateral: o 


Neste caso, deseja-se decidir entre 2s hipóteses: Ho: p = 0,5)e (Hj: p æ 0,5). 


Como Pr{9 ou 6 caras} = 1/04 + 1/64 = = 0,03125, pode-se rejeitar Ho no nível 
0,05 mas não no 0,01. 


28. Resolver o Probl, 27, quando a moeda apresentar cara 
5 vêzes. 
Solução: 


Teste unilateral: 


Como Prt5 ou 6 caras} = 6/64 + 1/64 = 7/64 = 0,1094, não se pode rejeitar Ho 
no nível 0,05 nem no 0,01. 


Teste bilateral: 


Como Pr{0 ou 1 ou 5ou 6 caras} = 2(7/64) = 0,2188, não se pode rejeitar 
Ho no nível 0,05, nem no 0,01. 
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Testes de médias e proporções, mediante o emprêgo de distribuições 
normais 


29, Uma urna contém bolas de gude que são vermelhas où azuis. Para 
testar a hipótese de haver proporções iguais dessas côres, resolve-se tomar a amostra 
de 64 bolas de gude, sem reposição, anotando-se as côres retiradas e adotando-se 


- a seguinte regra de decisão: (1) aceitar a hipótese, se forem retiradas 28 a 36 bolas 


vermelhas; (2) rejeitá-la, no caso contrário. 


(a) Determinar a probabilidade de rejeitar a hipótese, quando ela, é real- 
mente correta. 


(b) Interpretar graficamente a regra de decisão e ds resultados do item (q). 
Resp.: (a) 0,2606. 


30. (a) Que regra de decisão adotar-se-ia para o Probl. 29, quando se 
desejasse que a probabilidade de rejeitar a hipótese, quando ela é realmente 
correta, seja, no máximo, de 0,01, isto é, se se deseja o nível de significância 0,01? 
(b) Em que nível de confiança seria aceita a hipótese? (c) Qual seria a re- 
gra de decisão se fôsse adotado o nível de significância. 0,05? 


Resp.: (e) Aceitar a hipótese quando forém retiradas 22 a 42 bolas verme- 
lhas; no caso contrário, rejeitá-la. (b) 0,99. (c) Aceitar a hipótese quando forem 
retiradas :24-8 40 bolas vermelhas; no caso contrário; rejeitá-la; = - 


31. Suponha-se que, no Probl. 29, deseja-so testar a hipótese de ha- 
ver maior ` proporção de bolas vermelhas do que do azuis. (a) Que hipótese nula 
seria, considerada e qual a alternativa? (b) Usar-se-is. um teste uni ou bilateral? 
Por quê? (c) Que regra de decisão se adotaria se o nível de significância fôsse 
0,05? (d) Qual seria a regra de decisão se o. nível de significância fôsse 0,01? 


Resp.: (a) Ho: p=0,5; Hi: p > 0,5. O) Teste unilateral. (c) Rejeitar Ho: 
quando fôssem retiradas mais de 39 bolas vermelhas e, no caso contrário, aceitá-la, 
(ou não tomar nenhuma decisão). (d) Rejeitar Ho quando fôssem retiradas mais 
de di bolas vermelhas e, no caso contrário, aceitá-la (ou não tomar nenhuma 
decisão). 


32. Lançou-se um par de dados 100 vêzes e observou-se que o “sete” apa- 
receu 23 vêzes. Testar a hipótese do dado ser honesto, isto é, não-viciado, mediante 
o emprêgo de: (a) um teste bilateral; (b) um teste unilateral, no nível de signifi- 
cância 0,05. Discutir as razões da preferência de qualquer dêsses testes sôbre o 
outro. 


Resp.: (a) Não se pode rejeitar a hipótese no nível 0,05. (b) Pode-se rejeitar 
a hipótese no nível 0,05. 


33. Resolver o Probl. 32, quando o nível de significância fôr 0,01. 
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Resp: Não se pode rejeitar a hipótese no nível 0,01 em ambos os casos 
(a) ou tê j 


. “Um fabricante garante que, pelo menos 95% do equipamento que for- 
neceu å uma fábrica está de acôrdo com as especificações. O exame de uma amos- 
tre de 200 peças dêsse equipamento revelou que 18 estavam defeituosas. Testar 
E afirmativa, nos níveis de significância: (a) 0,01; (5) 0,05. 


Resp: Pode-se rejeitar a afirmativa em ambos os níveis de significância, 
mediante o emprêgo de um teste unilateral. 


35. "A percentagem de classificação 4, atribuída no curso de física de uma 
certa universidade durante um longo período, foi de 10%. Durante um período 
particular, houve 40 “A” em um grupo de 300 estudantes. Testar a significância 
dêsse resultado nos níveis: (a) 0,05; (b) 0,01. k 


Resp.: Mediante o emprêgo de um teste unilateral, o resultado é signifi- 
cativo no nível 0,05, mas não no 0,01. 


36. Verificou-se, por meio de experiências, que a tensão média de ruptura 
do fio de uma certa marca é de 9,72 kg, com o desvio padrão de 1,40 kg. Recen- 
temente, uma amostra de 36 peças do fio apresentou a tensão média de ruptüra 
de 8,93'kg. Pode-se concluir, nos níveis de significância: (a) 0,05; (b) 0,0! que 
o fio se tornou de qualidade inferior? 


Resp: Sim, em ambos os níveis, mediante o emprêgo de um teste unila- 
teral em cada caso. 


37. Em um exame, a que sè submeteram estudantes de grande número de 
escolas diferentes, o grau médio foi 74,5 e o desvio padrão 8. Em ume escola 
particular, em que 200 estudantes foram submetidos a êsse exame, o grau médio 
foi 75,9. Discutir a significância dêsse resultado no nível 0,05, do ponto de vista 
de um teste: (a) unilateral; (b) bilateral, justificando cuidadosamente as con- 
clusões baseadas nesses testes. 


Resp: O resultado é significativo no nível 0,05, em ambos os testes, uni e 
bilateral, 


38. Responder ao Probl. 37 quando o nível de significância fôr. 0,01. 


Resp.: O resultado é significativo no nível 0,01 em um teste unilateral mas 
não no bilateral. 


Curvas características de operação 

38: Com referência ao Probl. 29, determinar a probabilidade de aceita- 
hipótese de que há proporções iguais de bolas de gude vermelhas e azuis, 
«proporção real p de bolas vermelhas fôr de: (a) 0,6; ® 0,7; (c) 0,8; 
68) 0,8. 
(a) 0,3112; (b) 0,0118; (e) 0; (d) O; (e) 0,0118. 


40.. Representar graficamente os resultados do problema anterior, mediante 
a construção de um gráfico de: (a) B em função de p; (b) (1 — B)em função de p. 
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Comparar êsses gráficos com os do Probl. 12, mediante & consideração da 
analogia entre bolas vermelhas e azuis e cara e coroa, respectivamente. 

41. (a) Resolver os Probls. 13e 14, quando se resolver testar 400 cabos. 
(b) Que conclusões se poderá tirar, em relação aos riscos de erros do Tipo IL, quando 
o tamanho da amostra fôr aumentado? 

42. Construir: (a)as curvas CO; (b) de potência, correspondentes ao Probl. 81. 
Comper- „las com as do Probl. 14. 


Cartas de contrôle de qualidade 


43. Anteriormente, um certo tipo de fio produzido por uma fábrica apre- 
sentava a tensão média de ruptura de 8,64 kg e o. desvio padrão de 1,28 kg. Para 
verificar se o produto está de acôrdo com as especificações é tomada uma amostra 
de 16 peças cada 3 horas, e determinada sua tensão média de ruptura, Determinar 
os limites de contrôle de: (a) 99,73% ou 30; (b) 99%; (e) 95%, em uma carta 
de contrôle de qualidade e explicar suas aplicações. 

Resp.: (a) 8,64 + 0,96; (b) 8,64 = 0,83; (c) 8,64 + 0,63 kg. 

44. Em média, cêrca de 3% dos parafusos produzidos por uma companhia 
são defeituosos. Para manter ésse padrão de qualidade, é examinado uma amostra 
de 200 parafusos produzidos, cada 4 horas. Determinar os limites de contrôle 
de: (a) 99%; (b) 95%, para o número de parafusos defeituosos de cada amostra. 
Note-se que apenas os limites de contrôle superiores são necessários neste caso. 


Resp.: Os limites de contrôle superiores: são, respectivamente: (a) 6:(b) 4 
parafusos defeituosos. 4 


Testes que envolvem diferenças de médias e de proporções 


45. Uma amostra de 100 lâmpadas elétricas produzidas pela fábrica A 
indica a vida média de 1 190 horas, com o desvio padrão de 90 horas. Uma amos- 
tra de 75 lâmpadas produzidas pela fábrica B indica a vida média de 1230 horas, 
com o desvio padrão de 120 horas, Há diferença entre as vidas médias das duas 
marcas de lâmpadas, no nível de significância: (a) 0,05; (b) 0,01? 

Resp: (a) sim; (b) não. 

46. No problema anterior, testar 2 hipótese das lâmpadas fabricadas por 
B serem superiores às fabricadas por 4, adotados os níveis de significância: (a) 
0,05; (b) 0,01. Explicar as diferenças entre essa e a pergunta formulada no pro- 
blema anterior. Os resultados contrariam os do problema anterior? 

“Resp: Um teste unilateral, em ambos os níveis de significância, mostra 
que.a marca B é superior a 4. i 

“47. No exame de leitura realizado em uma escola primária, o grau médio 
de 32 rapazes foi 72, com o desvio padrão 8, enquanto que 0 de 36 meninas foi 75, 
com o desvio padrão 6. Testar nos níveis de significância: (a) 0,05; (b) 0,01, a hi- 
pótese das meninas serem melhores em leitura do que os meninos. 

Resp.: Um teste unilateral indica que a diferença é signihontivh no nível 
-(,05, mas não no 0,01. 
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48. Pare testar os efeitos de um nôvo fertilizante sôbre a produção de trigo, 
dividiu-se uma área de terreno em 60 quadrados de áreas iguais, spreseniando 
tôdas essas porções qualidades idênticas como solo, exposição ao sol ete. Aplicou- 
se o nôvo fertilizante em 30 áreas e nas restantes o fertilizante antigo. O número 
médio de “bushels” de trigo colhido por área, nas terras em que se usou o nôvo 
fertilizante, foi de 18,2, com o desvio padrão de 0,63. A média e o desvio padrão 
correspondentes às áreas em que se usou o fertilizante antigo foram 17,8 e 0,54, 
respectivamente. Testar e hipótese do nôvo fertilizante ser melhor do que o 
antigo, adotados os níveis de significância: (a) 0,05; (b) 0,01. 

Resp.: Um teste unilateral indica que o nôvo fertilizante é superior, em 


ambos os níveis de significà 


49. As amostras aleatórias compostas de 200 parafusos produzidos pela 
máquina 4 e de 100 produzidos pela máquina B apresentam 19 e 5 parafusos 
defeituosos, respectivamente. Testar a hipótese de: (a) as duas máquinas apresen- 
tarem padrões de qualidade diferentes; (b) a máquina B ter padrão melhor do 
que o de 4. Adotar o nível de significância 0,05. 


Resp.: (a) Um teste bilateral não indica diferença de padrão “de qualidede, 
no nível 0,05. (b) Um teste unilateral indica que B não tem padrão melhor do 
que o de A, no nível 0,05. 


50. Duas urnas, 4 e B, contêm números iguais de bolas de gude, mas são 
desconhecidas as proporções de vermelhas e de brancas de cada uma delas, Foi 
selecionada ums amostra de 50 bolas, com reposição, de cada uma das urnas, © 
se verificaram 32 vermelhas provenientes de A e 23 vermelhas de B. Adotado 
o nível de significância 0,05, testar as hipóteses de: (a) terem as duas urnag pro- 
porções iguais de bolas vermelhas; (b) Ater proporção de bolas vérmelhas maior 
do que a de B. 


Resp.: (a) Um teste bilateral, no nível 0,05, é falho para rejeição da bipó- 


tese de proporções iguais. (b) Um teste unilateral, no nível 0,05, indica que A 
tem proporção de bolas vermelhas maior do que a de B. 


Testes que envolvera distribuições binomiais 


51. Com referência ao Probl. 23, determinar o menor número de ques- 
tões que um estudante deve responder corretamente para que o instrutor esteja, 
seguro de que o estudante não está simplesmente adivinhando, adotado o nível 
de significância: (a) 0,05; (b) 0,01; (c) 0,001; (d) 0,06. Discutir os resultados. 

Resp.: (a) 9; (b) 10; (c) 10; (a) 8. 

52. Construir, para o Probl, 24, gráficos semelhantes aos do Probl, 10. 

53. Resolver os Probis. 23 & 25, quando o valor 7 da regra de decisão 
do Probl. 23 fôr substituído por 8. E 

54, Lençou-se ums moeda 8 vêzes, aparecendo cara 7 vêzes, Pode-se re- 
jeitar a hipótese da moeda ser honesta, nos níveis de significância: (a) 0,05; (ò) 
8,10; (c) 8,01? Empregar um teste bilateral, 

Resp.: (a) não; (b) sim; (c) não. 
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55. Resolver o Probl. 54, empregando um teste unilateral. 

Resp.: ta) sim; (b) sim; (c) não. 

56. Resolver o Probl. 54, quando aparecer cara 8 vêzes. 

Resp.: (a) sim; (b) sim; (c) Sim. 

57. Resolver o Probl. 54, quando aparecer cara 6 vêzes. 

Resp.: (a) não; (b) não; (c) não. 7 e 

58. Uma ums contém grande número de bolas de gude vermelhas e brancas, 


Uma amostra aleatória de 8 boles revelou 6 brancas e 2 vermelhas. Empregando 
os testes e os níveis de significância apropriados, discutir as proporções das boles 
vermelhas e brancas da urna. 

59. Discutir como a teoria da amostragem pode ser usada para investigar 
as proporçõés dos diferentes tipos de peixes existentes em um lago. 


CaríruLo 11 


TEORIA DAS PEQUENAS AMOSTRAS 


Distribuição de “Student” t e Distribuição de Qui quadrado 


Pequenas amostras 


Em capítulos anteriores lançou-se mão, frequentemente, do fato 
de, para amostras de tamanho N > 30, denominadas grandes amostras, 
as distribuições amostrais de várias estatísticas serem aproximada- 
mente normais, tornando-se a aproximação melhor com o cresci- 
mento de W. Para as amostras de tamanho N < 30, denominadas 
pequenas amostras, essa aproximação não é boa e torna-se pior com o 
decréscimo de N, de modo que devem ser introduzidas as modifica- 
ções convenientes. ` 

O estudo das distribuições amostrais de estatísticas de pequenas 
amostras é 'denominado teoria das pequenas amostras. Entretanto, o 
nome mais apropriado seria, teoria exata da amostragem, visto que os 
resultados obtidos são válidos tanto para as grandes como para as 
pequenas amostras. Nesse capítulo serão estudadas duas distribui- 


ções importantes, denominadas de “Student” te de qui quadrado, ` 


Distribuição de “Student” t 
“Define-se a estatística: 


Zu VR RE Gui 
= N= ps , 
TG VN 
X-u 

t: ág. 280). 
Z (e vte 20 


= 


(62) 


semelhante a z, dada por z = 
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Considerando-se amostras de tamanho N, extraídas de uma po- 


 pulação normal (ou aproximadamente normal) de média 4, e, se para 


cada amostra, calcular-se o valor de i, por meio da média amostral 
Z e do desvio padrão s ou 3, pode-se obter a distNhaição amostral de t. 


Essa distribuição (veja a Fig. 11-1) é dada por: 


Yo 


j i £ Ve? 
TA 
TÁ 


(2) 


em que Yo é uma constante que depende de N, de modo que a área 
subtendida pela curva é igual a 1, e a constante y = (W — 1) é deno- 
minada número de graus de liberdade (v é a letra grega nu). Para a 
definição de graus de liberdade, veja a pág. 315. 


Distrihulção de Stodont (2) para várias valoros de » 
Fig. Mk 


A distribuição (2) é denominada distribuição de “Student? t, por- 
que seu descobridor, Gosset, publicava seus trabalhos sob o pseudô- 
nimo de “Student”, durante a primeira parte do século XX. 


Para grandes valores de v ou de N (certamente N z 30), as 


curvas (2) são muito próximas da normal reduzida Y= R grite, 


como o mostra a Fig. 1i. 


Intervalos de confiança 


Como nas distribuições normais do Capítulo 9, podem ser defini- 
dos“os intervalos de confiança de 95%, 99% ou outros, mediante o 
emprêgo da tabela da distribuição t do Apêndice IH. Dessa maneire 
a média da população, 4, pode ser avaliada dentro dos 
de confiança especificados. 
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Por exemplo, se — too € tosrs São os valores de £, para os 
quais 2,5% da área ficam localizados em cada “extremidade” da dis- 
-tribuição é, então o intervalo de confiança de 95%, para £, é 


— oor < 


-uyy TT < tors l (8) 


do qual se verifica que yu é avaliado para que dentro do intervalo 


com a confiança de 95% (isto é, probabilidade de 0,95). Note-se 
que Zoss representa o valor do percentil 97,5, enquanto que tooss = 
= — too representa o do percentil 2,5. 


Em geral, podem-se representar os limites de confiança para as 
médias populacionais por: 


em que os valores = f, são denominados críticos ou coeficientes de 
confiança, e dependem do nível de confiança, desejado e do tamanho 
da amostra. Ples podem ser tirados do Apêndice III. 


Uma comparação da expressão (5) com a dos limites de confiança 
(E zoly N) do Capítulo 9, pág. 201, mostra que, para pequenas 
amostras, 2, (deduzido da distribuição normal) é substituído por fe 
(relativo à distribuição {) e o valor de o por V NEN — 1) s= 3, que 
é a estimativa amostral de o. Quando N aumenta, ambos os métodos 
tendem para a coincidência. 


Testes de hipóteses e significância 


Os testes de hipóteses e. significância, estudados no Capítulo 10, 
são facilmente estendidos aos problemas que envolvem pequenas 
amostras, com a única diferença da substituição do escore -z ou da 
estatística z pelo escore t ou estatística L conveniente. 


-médias e-desvios padrões dados -po 


da pág. 282, do escore z por o; = 
z pag : 


co 
part 
e 
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1. Médias 


Para testar a hipótese He, de uma população normal ter a média 
u, adota-se o escore t ou a estatística t 


EEN =] | = ŽE VN, (6) 


S 


em que X éa média de uma amostra de tamanho N. 


Isso é anáļogo xo emprégo do escore z == pura os gran 


aj 
des valores de A, exceto quanto ao fato de ser usado 3 = 
N =I) sem vez dë g. A diferença consiste em que, ao 
passo que z tem distribuição normal, t apresenta uma distribuição 
de “Student”. Quando N aumenta, ambas tendeis a coincidir. 


2. Diferença de médias 


Suponha-se que duas amostras aleatórias de tamanhos N, o 
são extraídas de populações normais cujos desvios padrões são 
iguais (04 = 04). Suponha-se, ainda, que essas duas amostras têm 


Para testar a hipótese Ho do que us amostras provêem da mesma 
população (isto é, My = Ho bem como 04 = 03) adota-se o escore t 


dado por: 
/ 
+ em que o = NE 


REENE A PT El 
A distribuição é a de “Student? t, como v = (Ni de Ny — 2) 


gruas de liberdade. 


O uso de (7) é tornado plausível pela substituição, na Eq. (2), 
= g 6 depois pela adoção, para 


estimativa de o°, da média ponderada 


(Ni = 5 
Wi = 1) A 


AJ 


em que 8 e 84 são as estimativas imparelais de o? e 04º (veja a 
Propriedade 3 da pág. 114). 3 


a Tespectivamente; mm 
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„A distribuição de qui quadrado 


Define-se a estatística: 


xi = ds Bt (8) 


em que x é a letra grega qui e x? é lido como qui quadrado. Consi- 
.derando-se amostras de tamanho N retiradas de uma população 
normal, com o desvio padrão 0, e se, para cada amostra, fôr calculado 


Distribuição co Quiquadrado (x?) para vários valores de 7, 
Fig. 11-2 


o valor de x’, pode-se obter uma distribuição amostral dêsses valores.. 
Essa distribuição, denominada de qui quadrado, é dada por: 


Y = EN de = Yoxrt et, (9) 


em que y = N — 1 é o número de graus de liberdade e Y, é uma cons- 
tante dependente de v, de modo que a área total subtendids pela 
curva é igual a 1. As distribuições de qui quadrado, correspondentes 
a vários valores de v, estão apresentadas na Fig. 11-2, O valor má- 
ximo de Y ocorre para x°? = v — 2, quando v È 2. 


“Intervalos de confiança para x? 


omo foi feito para as distribuições normal e £, podem ser defi- 
nidos Os limites e.intervalos de confiança de 95%, 99% e outros, 
para X mediante o emprêgo da tabela da distribuição de x? do 
„Apêndice IV. Dessa maneira, pode-se avaliar, dentro dos limites 
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de confiança especificados, o desvio padrão populacional o, expresso 
em função do desvio padrão amostral, s. 

“Por exemplo, se om e ati são os valores de x? (denomi- 
nados valores críticos), para os quais 2,5% da área são localizados 
em. cada “extremidade” da distribuição, o intervalo de confiança 
de 95% é, então: 


2 


2 Ns? ? 
Xoo < = < Xo,s70? (10) 


do qual se deduz que a é estimado para que fique situado dentro do 
intervalo: 


VN ese s/N 


Xo,975- “Xo,026 


a1) 


com o grau de confiança de 95%. De maneira semelhante, podem ser 
determinados outros intervalos de confiança. Os valores Xoo è` 
Xoor representam, respectivamente, os valores dos percentis 2,5.€ 
97,5. 

A tabela do Apêndice IV, dá os valores dos percentis corres- 
pondentes aos graus de liberdade v. Para grandes valores de v(v =30), 
pode-se utilizar o fato de (V 2x? — 4/2» — 1) ter distribuição apro- 
ximadamente pormal, com média zero e desvio padrão 1, de modo 
que podem ser usadas as tabelas de distribuição normal, quando ` 
v 230. 

Então, se Xp € Zp são os percentis de ordem p das distribuições 
de qui quadrado e normal, respectivamente, tem-se: 


Xo = F (io HV — DR (12) 


Nesses casos, há concordância muito estreita com os resultados 
obtidos nos Capítulos 8 e 9. R 

Para ulteriores aplicações da distribuição de qui quadrado, 
veja o Capítulo 12. 


Graus de liberdade 


Para calcular-se uma estatística como as definidas em (1) ou 
(8), é necessário usar as observações realizadas em uma amostra, 
bem como certos parâmetros populacionais. Se êsses parâmetros 
são desconhecidos, êles devem ser estimados por meio dos da amostra. 
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O número de graus de liberdade de uma estatística, geralmente 
representado por », é definido como o número N de observações 
independentes da amostra (isto é, seu tamanho) menos o número k 


dos parâmetros populacionais que devem ser estimados por meio - 


das observações amostrais. Simbôlicamiente, y = N — k. 


No caso da estatistica definida pela relação (1), o número de 
observações independentes da amostra é N, do qual- podem ser cal- 
culados X e s. Entretanto, como x deve ser avaliado, k = 1 e, então, 
vaN=ehl 

No caso da estatística definida pela relação (8), o número de 
observações independentes da amostra é N, do qual pode ser calcu- 
lados. Entretanto, como g deve ser avaliado, k=1 e, então, v=N—1. 


Problemas Resolvidos 
Distribuição de “Student” t 


à. O gráfico da distribuição de “Student” t, com 9 graus de 
liberdade, está representado na Fig. 
11-3. Determinar os valores de 

_ fı para os quais: (a) a área som- 
breada à direita = 0,05; (b) a área 
sombreada total=0,05; (c) a área 
não-sombreada total (ou em bran- 
co) = 0,99; (d) a área, sombreada 
à esquerda = 0,01; (e) a área à 
esquerda de & = 0,90. 


Solução: 


(a) Se a área sombreada à direita é 0,05, então a área à esquerda de ty é 
(1 — 0,05) = 0,95 e à representa o percentil 95º, togs. 


Reportando-se à tabela do Apêndice III, percorre-se a coluna encabeçada 
por » para baixo até encontrar a casa 9. Segue-se, então, para a direita até 
entontrar a coluna encabeçada por toss- O resultado, 1,83, é o valor desejado 
de 4 


(b) Se a área total sombreada é 0,05, então, por simetria, a sombreada à -. 


direita é 0,025. Portanto, a área à esquerda de t; é(1 — 0,025) = 0,975, e tı repre- 
senta o percentil 97,5.º, fog. Na tabela do Apêndice III, encontra-se 2,26 para 
o valor desejado de i y 
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(e) Se arárea total não-sombreada é 0,99 
(1 — 0.99) = 0,01, é a sorabreads à direita é 0,0 
“mina toso.= 3,25, 


mtão a área total sombreada € 
= 0,005. Na tabela se deter- 


(d) Sea área sombreada à esquerda é 0,01, então, por simetria, a sombreada 
à direita é 0,01. Na tabela, too = 2,82. Portanto, o: valor crítico de +, para o 


. qual a área sombreada à esquerda é 0,01, é igual a — 2,82. 


(e) Sea área à esquerda de ty é 0,90, então ty corresponde ao percentil 90-9% 
too, que, na tabela, é igual a 1,38. 


2. Determinar os valores críticos de t para os quais a área da 
extremidade direita da distribuição t é 0,05, quando o número de graus 
de liberdade » fôr igual a: (a) 16; (b) 27; (c) 200. 


Solução: 


Usando a tabela do Apêndice III, encontram-se, na coluna encabeçada por 
loas, o3 valores: (a) 1,75 correspondente à v = 16; (b) 1,70 correspondente” a 
y = 27; (c) 1,045 correspondente a v = 200. (O último valor é o que seria obtido 
mediante o emprêgo da curva normal, Na tabela do Apêndice III corresponde 
à casa da última linha, assinalada como œ, isto 6, infinito.) 


3. Os coeficientes de confiança de 95% (“bilateral”), para a 
distribuição normal, são dados por + 1,96. Quais serão os coeficientes 
correspondentes para a distribuição t, quando: (a) y = 9; (b) v = 20; 
lo) v.=30;.(d).v = 602. à 


Solução: 


Para os coeficientes de confiança de 95% ("bilateral"), a área total sombreada, 
da Fig. 11-3 deve ser 0,05. Portanto, a área sombreada da extremidade da direita 
é 0,025 e o valor crítico correspondente de é é toys. Então, os coeficientes de 
confiança desejados são: + tor. Para os valores dados de y, êles são: (a) +: 2,26; 
(b) = 2,09; (c) + 2,04; (d) = 2,00. 


4. Uma amostra de.10 medidas do diâmetro de uma esfera 
apresentou a média X = 4,38 polegadas e o desvio padrão s = 0,06 
polegada. Determinar os limites de confiança de: (a) 95%; (b) 99%, 
para o diâmetro real. 


Solução: 
(a Os limites de confiança de 95% são dados por: 
E + oons (s/ VN = 1). 


Como v=N-—1L=10-— 
o Probi. Sa). Então, para X 


= 9, encontra-se toos = 2,26 [veja também 
= 4,38 e s = 0,06, os limites de confiança dese- 


‘a 4,425 polegadas. 
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indos de 95% são: 


4,38 + 2,26 (0, 06/10 = 1 = 4,38 & 0,0452 polegada. 


conseguinte, pode-se ester 95% confiante de que a média verdadeira 
14 compreendida entro (4,38 — 0,045) = 4,335 polegadas e (4,38 + 0,045) = 


O), Os limites de confiança de 99% são dados por: 


X e topos (3 V/ 


Para v = 9, to,0s 


4,38 «+ 9,26. (0,06/4/10 — I} = 4,88 = 0,0650 polegada e o intorvalo de con- 
fiança de. 99% é de 4,315 a 4,445 polegadas. 


3,25. Então, os limites de confiança de 99% são 


E (a) Resolver o problema anterior, admitindo-se que os 
métodos das teorias das grandes amostras são válidos. (b) Comparar 
os resultados dos dois métodos. 


Solução: 


(a) Segundo os métodos da teoria das grandes amostras, os limites de con- 
fiança de 95% são: 


X + 1,960/VN = 4,88 1,96 (0,06/N10) = 4,38 + 0,037 polegada, em que 
se adotou o desvio padrão amostral, 0,06, para a estimativa de o. 
De modo semelhante, os limites de confiança de 99% são: 


E + 2,580/VN = 4,38 + 2,58 (0,06/4/10) = 4,38 + 0,049 polegada. 


(b) Em cada caso, os intervalos de confiança, obtidos mediante o emprêgo 
dos métodos das pequenas amostras, ou exato, são mais largos do que os obtidos 
mediante o emprêgo dos métodos das grandes amostras. Isso era de se esperar, 
visto que se dispõe de menor precisão com as pequenas amostras do que com às 
grandes, 


6. Antigamente, uma certa máquina produzia arruelas que 
tinham a espessura de 0,05 polegada. Para se verificar se a máquina 
está trabalhando adequadamente, escolheu-se uma amostra de 10 
arruelas, cuja espessura média é 0,053 polegada e cujo desvio padrão 
é 0,003 polegada. Testar a hipótese da máquina estar trabalhando 
adequadamente, adotados os níveis de significância: (a) 0,05; (b) 0,01. 
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Para a hipótese Ho tem-se: 


(a) Para um teste bilateral, no nível de significância 0,05, adota-se a regra 
de decisão: 

(1) Aceitar Ho quando t estiver compreendido no intervalo entre — logs 
e toons, O qual, para 10 — 1 = 9 graus de liberdade, é o que vei de — 2,28 & 2,26. 

(2) No csso contrário, rejeitar Ho. 

Como t = 3, rejeita-se Ho no nível 0,05. 

(b) Para um teste bilateral, no nível de significância 0,01, adota-se s regra 
de decisão: , 

(1) Aceitar Ho, quando t estiver dentro do intervalo de — logs & logos, 
o qual, para 10 — 1 = 9 graus de liberdade, é o que vai de — 3,25 8 3,25. 

(2) No caso contrário, rejeitar Ho. . 

Como t = 3, aceita-se Ho, no nível 0,01. Como sé pode rejeitar Ho no nível 
0,05, mas não no 0,01, pode-se dizer que os resultados amostrais são provavelmente 
significativos (veja a terminologia, no fim do Probl, 5 do Capítulo: 10). Seria con- 
veniente, em consequência, vistoriar s máquina ou, pelo menos, tomisr uma-dutra 
amostra. j 


7. Um ensaio das tensões de ruptura de 6 cabos produzidos por 
uma companhia mostrou a tensão média de ruptura de 7750 kg è o 
desvio padrão de 145 kg, ao passo que o fabricante declara que aquela 
tensão média é de 8000 kg. Será verdadeira a declaração do fabri- 
cante, nos níveis de significância: (a) 0,05; (b) 0,01? 


Solução: 
Deve-se decidir entre as hipóteses: 


Ho: p = 8000 kg, e a declaração do fabricante é justificada. 
Hy u <8000kg, e ela não o é, de modo que um teste unilateral é necensá- 
rio. Para a hipótese Ho tem-se: 


Ato = 000 O EST 


= — 3,86. 


(a) Para um teste unilateral, no nível de signiticância 0,05, adota-se a regra 
de decisão: 


(1) Aceitar Ho, quando t é superior è — too, O qual, pais 6-1 =5 


“graus de liberdade, significa L> — 2,01. 


(2) No caso contrário, rejeitar Ho. 
Como t = — 3,86, rejeita-se Ho. 


tb) Para um teste unilateral, no nível de significância 0,01, adota-e a regra 
de decisão: 
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(1) Aceitar Ho quando t fôr superior a — tos, o qual, para 5 graus de 
liberdade, significa ¿> — 3,36, 

(2). Rejeitar Ho, no caso contrário. 

Como t = — 3,86, rejeita-se Ho. 


Conclui-se que é extremamente improvável que a declaração do fabricante 
seja justificada. 


8. O QUI. (quociente de inteligência) de 16 estudantes de uma 
zona de certa cidade apresentou a média, 107, com o desvio padrão 
10, enquanto que òs de 14 estudantes de outra zona da cidade apre- 
sentou a média 112, com o desvio padrão 8. Há uma diferença. signi- 
ficativa entre os Q.I. dos dois grupos, nos níveis de significância: 
(a) 0,01, (è) 0,05? f 


Solução: 


Se pı e Hy representam os Q.I. médios populacioneis dos estudantes das duas 
áreas, deve-se decidir entre as hipóteses: 

Ho: pı = Ho, e não há, essencialmente, diferença importante entre os grupos, 

Hi: pi po, e há uma diferença significativa entre éles. 

Para a hipótese Ho: 


KR Nisi? + Nasa? 
l= » em que o = MMS 


o VN + Na 
Então: E 


2 2 ua 
pa rea a =9,44 e ta IO as 
TIET 9,44 V/16 + I/14 


(a) Com base em um teste bilateral, no nível de significância 0,01, rejeitar- 
se-ia Ho, quando t estivesse fora do intervalo de — tosòs & loos, o qual, para 
(Ni + Na — 2) = (16 + 14 — 2) = 28 graus de liberdade, é o que vai de — 2,76 
a 2,76. 

Por conseguinte, não se pode rejeitar Ho, no nível de significância 0,01. 

(b) . Com base em um teste bilateral no nível dé significância 0,05, rejeitar-se. 
ia Ho, quando £ estivesse fora do intervalo dé — togro & looms, O qual, para 28 
graus de liberdade, é o que vai de — 2,05 a 2,05. Por conseguinte, não se podê 
rejeitar Ho, no nível de significância 0,05. 


Conclui-se que não há diferença significativa entre os Q.I. dos dois grupos, 


9, Em um pôsto agrícola, desejou-so testar o efeito de certo 
fertilizante na produção do trigo. Para realizar êsse desiderato, foram 
escolhidos 24 tratos de terreno de áreas iguais, metade dos quais foi 
tratada com o fertilizante, e a outra não (grupo de contrôle). Tódas 
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ram mantidas iguais, "A produção média de 
tilizante foi de 4,5 “bushels”, com o desvio 
canteiros tratados foi de 5, 1 “bushels”, 


as outras condições for 
trigo nos tratos sem is 
padrão 0,4, enquanto que x 


“com o desvio padrão de 0,36. Pode-se concluir que há um aumento 


significativo da produção de trigo por causa do fertilizante, se forem 
adotados os níveis de significância: (a) 1%; (b) 5% ? 


Solução: 


Sejam p, e m 88 produções médias populacionais de trigo nos terrenos tra- 
tados e não, respectivamente; deve-se decidir entre as hipóteses: 


Ho: pı = po, e a diferença é devida ao acaso, 
Hu m > e, co fertilizante aumenta a produção. 


Para a hipótese Ho: 


Então: 


120,40)? + 1200.36) = 0,897 e i= ALA 
a q 12 +122 : 0,397 V112 + 1/12 


(a) Com base em um teste unilateral, no nível de significância 0,01, rejeitar- 
se-ja He. quando t fôsse superior a. to99,.0. qual, pas. (Nak Ng. 2) m (12% 
+12 — 2) = 22 graus de liberdade, é 2,51. 

Em consegiiência, não se pode rejeitar Ho no nível de significância 0,01, 

(b) Com base em um teste unilateral no nível de significância 0,05, rejeitar- 
se-ja Ho quando t fôsse superior à toos, 0 qual, para 22 graus de liberdade, é 1,72. 
ar Ho no nível de significância 0,05. 


Por conseguinte, pode-se reje: 

Conclui-se que o aumento de produção do trigo, resultante do uso do ferti- 
lizante, é provâvelmente significativo. 

Entretanto, antes de chegar a conclusões « 
dade do fertilizante, seria desejável que se dispuse: 


itivas, concernentes à utili- 
sse de evidências ulteriores. 


A distribuição de qui quadrado 


10. O gráfico da distribuição de qui quadrado com. 5 graus de 
liberdade está representado na Fig. 11-4. Determinar os valores 
críticos de x°, para os quais: 

(a) A área sombreada à direita = 0,05. 


(b) A área total sombreada = 0,05. 


o A área sombreada à esquerda = 6,10. 


(d) A área sombreada à direita = 0,01. ` 


Solução: 


(a) Sen área sombreada à direita é 0,05, então a sitüada à esquerda de x? 


é (1: 0,05) = 0,95, e xy” representa o 95.º parent, Kås 


A 


2 
Xa 


Fig. Ng 


Na tabela do Apêndice IV, percorre-se a coluna encabeçada por » para 
baixo, até' encontrar à casa 5. Segue-se, depois, paia a direita, até encon- 
trar a coluna encimada por Xos. O resultado, 12,1, é o valor crítico dese- 
jado de x°. 


(b) Como a distribuição é assimétrica, há vários valores críticos para os 
quais a área total sombreada é igual a 0,05. Por exemplo, a área, sombreada à 
direita noderio, ser 0,04, enquanto que à esquerda seris 0,01. É costume, entre- 
tanto, a menos que haja especificação em contrário, escolher as dues áreas de 
valores iguais. Nesse caso, então, cada área valerá 0,025. 

Se a área sombreada à direita, é 0,025, a situada à esquerda de x é(1- 0,025) = 
= 0,975, € X? representa o 97,5.º percentil, Xen que, ne tabela do Apêndice 
IV, é de 12,8.. 

De modo semelhante, se 2 áres sombreada à esquerde. é 0,025, a situada à 
esquerda de X1? é 0,025, 'e Xi? representa o 2,5º percentil, X6025, que é igusl a 
0,831. À 


Portanto, os valores críticos são 0,831 e 12,8. 
(c) Sea área DaN à esquerda é 0,10, x: representa o 10.º percentil, 
xa, 1w, que é igual a 1,81, 
(a Se a área sombreada à direita é 0,03, a área à esquerda de x2? é 0,99, e 
1 xêR pienta o 99°, percentil, X9 que é iguab d 15,1. 
11. Determinar os valores críticos de x? para os quais a área 
ila extremidade direita da distribuição x? será 0,05, quando o número 
de graus de liberdade, v, fôr igual a: (a) 15; (b) 21; (e) 50. 
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Solução: | 

Usando a tabela do Apêndice IV encontram-se, na columns encimada por 
xass os valores: (a) 25 correspondente a y = 15; (b) 32,7 correspondente a » = 
= 21; (c) 87,5 correspondente a v = 50. $ 

12. Determinar os valores medianos de x? correspondentes aos 
graus de liberdade: (a) 9; (b) 28; (0) 40. 


Solução: 


Usando a tabela do Apêndice IV encontram-se, na coluna encimada por 
Xoro (porque a mediana é o 50.º percentil), os valores: (a) 8,34 correspondente 
a » = 9; (b) 27,8 correspondente & v = 28; (c) 39,8 correspondente a 7 = 40. 

É interessante notar que os valores medianos são muito aproximadamente 
iguais sos números de graus de liberdade. De fato, para » > 10, os valores me- 
dianos são iguais a (v — (),7), como se pode verificar na tabela, 


13. O desvio padrão das alturas de 16 estudantes do sexo mas- 
culino, escolhidos aleatôriamente em uma escola de 1000 estudantes 
dêsse sexo, é 2,4 cm. Determinar os limites de confiança de: (a) 95%; 
(b) 99%, do desvio padrão para todos os estudantes do sexo masculino 
da escola. 


Solução: 

(a) „Os limites de confiança de 95% são dados por sV N/xosn è 8 VÄI Xas. 
Parè v= 16 — 1 = 15 graus de liberdade, Xô sm = 27,5 ou Xos = 5,24 e 
xã,0m = 6,26 ou Xoo = 2,50. 


Então, os limites de confiança de 95% são 2,40 V 16/5,24 e 2,40 /16/2,50, 
isto é, 1,83 e 3,84 cm. Em consegiiência, pode-se ter 95% de confiança de que 
o desvio padrão populacional está entre 1,83 e 3,84 em. 


(b) Os limites de confiança de 99% são dados por: 
8 Nixosos e 4/Nixooos. 


Para y = 16 — i = 15 graus de liberdade, x03% = 82,8 ou Xos = 5,73 
e Xdoos = 4,60 ou Xoo = 2,14. 

Então, os limites de confiança de 99% são 2,40 /18/5,73 e 2,40 V 16214, 
isto 6, 1,68 e 4,49 cm. 


Portanto, pode-se estar 99% confiante em que o desvio padrão populacional 
está entre 1,68 e 4,49 cm, 


14. Determinar Xin para os graus de liberdade: (a) » = 50; 
{yv = 
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Solução: 


Para v maior do que 30, pode-se utilizar o fato de (VI — Vv — 1) ter 
distribuição aproximadamente nermgl; com a média zero e-o desvio padrão 1. 
Então, se zp é O escore percentil z da distribuição normal reduzida, pode-se escrever, 
com grau elevado de aproxima. i 


t= V =z ou VO = t Vy, 


Hep + Vi — Ip 


UOL + 4 
Apêndice IV, 


= 09,2, 


(b) Se vs 100, Xis = | 
(valor real = 124,3). 


F64 + VIII = 1240 


15. O desvio padrão das durações para uma amostra de 200 
lâmpadas elétricas, é 100 horas. Determinar os limites de confiança 
de: (a) 95%; (b) 99%, para o desvio padrão de tôdas as lâmpadas 
elétricas dêsse tipo. ` 


Solução: 


(a) Oa limites de confiança de 95% são dados por: sV Nixosis e sV Nixon 
Para v = 200 — 1 = 199 graus de confiança, determinam-se, como no Probl. 14: 


Xons = $ [zosis + VZGON = 1] = $ (1,964 19,92)? = 239; 
aus = É zoe + VAO) 11º = (> 1.06 410,99) = 101, 
dos quais Xo,97s = 15,5 e Xoor = 12,7, 

Então, os limites de confiança de 95% são 100 /200/15,5 = 912 e 
1004: 200/12,7 =111,3 horas, respectivamente. Rm consegliência, pode-se estar 95% ` 
confiante em que o desvio padrão populacional estará entre 91,2 e 111,3 horas. 
Esse resultado poderia ser comparado com o do Probl. 17(a) do Capítulo 9. 

(b) Os limites de confiança de 99% são dados por: 


e vs X05- 


Para v = 200 — 1 = s de liberdade: 


A 
Xo,995 r : 
Xoo = É beos + VAID — 1 = (= 2,58 + 19,99 = 150; 


dos quais Xo9 = 15,0 e Xuges 


t = 889 e 


ter o gran 
entre 888 H5S 


Então, os limites 
1004/200/12.2 = 115,9 hor 
de confiança de 99% de que o d 
horas. Esso 
“apítulo. 9. 


ser comparado com o du 
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16. É posstvel.obter um intervalo de confiança, de 95% para o 

» desvio padrão populacional, cuja amplitude seja menor do que a 
“encontrado no Probl. 15(a) ? 


Solução: 


Os Jimites de confiança de 95% para o desvio padrão populacional, como 
foram determinados no Probl, 15(a), foram obtidos escolhendo-se os valores 
críticos de xê, de modo que a área em cada extremidade era de 2,5%. JT possível 
determinarem-se outros limites de confiança de 95%, mediante a escolha de 
valores «ríticos de x? para os quais a soma das di as extremidades seia 5%, 
ou 0,05, mas as áreas de midade não serão iguais, 


da extr 


Na Tabela 11) foram obtidos àsses diversos valores críticos (usando os mé- 
todos do Probl, 14) ¢ estão indicados os intervalos de confiança de 95% cor. 


responden tes. 


Tabela 11.1 


Intervalo de 
Valores críticos confiança de. | Amplitude 
85% 


Xoo = 12,44, 'Xoss = 15,32 | 92,3 a 113,7 21,4 


Xoo = 12,64, Xoo = 15,42 [917 a 


Xans = 12,76, Xogs = 15,54 | 91,0 å 


Xoo = 12,85, Xos = 15,73 | 89,9 a 


19,8, é o compreendido de 91 a 10,8. Podo mesmo ser 
de menor amplitude, med 
aproximação, adotando-se valores críticos como Xeos e Xot Xoo © Xo,982 
ete. 

Geralmente, contudo, o decréscimo de intervalo obtido dessa maneire é 
comumente desprezível e não compensa o trabalho despendido. E 


17. Anteriormente, o desvio padrão dos pesos de certos reci- 
pientes de 40 kg, cheios por úma máquina, era 0,25 kg. Uma amostra 
aleatória de 20 pacotes apresentou o desvio padrão de 0,32 kg. O 
aumento aparente de variação é significativo, nos níveis de signifi- 
cância: (a) 0,05; (b) 6,01? 


ear 
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ecidir entre as hipótes 


15 kg, e o resultado observado é devido so acaso. 
> 0,25 kg, e à variação aumentou. 
O valor de x? para a amostra é: x? = Ne'jo? = 20,327 0,25) = 32,8. 


(o “Mediante o emprêgo de um teste unilatéral, rejeitar-se-ia Ho, no nível 


de significância 0,05, quando o valor amostral de x fòsse superior & Xo que é . 
igual 0,1, paraov = 20 — 1 = 19 graus de liberdade. Em consegiência, re- 
jeitar-se-ta Ho no nível de siguificância 0,05. 


(b) ` Mediante o emprêgo de um teste unilateral, rejeitar-se-ia Ho, no nível 
de significância 0,01, quando o valor amostral de x? fôsse superior a xs que 
é igual a 36,2, para 19 graus de liberdade. Portanto, não se rejeitaria Ho no nível 
de significância 0,01. ` f 

Conclui-se que a variação provavelmente cresceu. Deve-se proceder a um 
exame da máquina. 


Problemas Suplementares 


Distribuição de “Student” t 


18. Pera uma distribuição de “Student” com 15 graus de liberdade, determi- 
nar o valor de ty, de modo que: (a) a área à direita de h seja 0,01; (b) a área à es- 
querds de ty seja 0,95; (c) a área à direita de h seja 0,10; (d) a soma das áreas à 
direita de ty e à esquerda de — t sejá 0,01: (e) a área entre — he ti seja 0,95. 

Resp.: (a) 2,69; (b) 1,75; (c) 1,34; (d) 2,955. (0) 2,13. 


19. Determinar os valores criticos de é, para os quais» áree da extremidade 
direita da distribuição será 0,01, se o número de graus de liberdade » fôr iguala: 
(a) & (b) 12; (e) 25; (d) 80; (e) 150. í 

Resp.: (a) 3,75; (b) 2,88; (c) 2,48; (d) 2,39; (e) 2,33. 

20, Determinar os valores de ty, parè a distribuição de “Student”, que satis- 
façam esde uma das seguintes condições: (a) área entre — tre t de 0,90 e » = 25; 
(b) área à esquerda de — ty de 0,025e » = 20; (c) some das áreas à direita 
de tre à esquerda de — ti de 00te v = 5; (d) área à direita de t de 0,55 e » = 16. 

Resp: (a) 1,71; (b) 2,09; (c) 408; (d) — 0,128. 


2. “Se a variável U apresente uras distribuição de “Student” com y = 10, 
determinar a constante C de modo que: (a) Pr {U > C} = 0,05; Pri- es 
SU EO = 0,98; (0) Pr {U <C) = 020; (0): PrÍU = C) = 0,90. 

o Rg (a) 1,81; (b) 2,76; (e) — 0,879; .(d) — 187. ` 


Os coeficientes de confiança cb 999% (bilateral), pars uma distribuição 
norma}, são dados por -= 2,58, Quais serão os coeficientes correspondentes para 
a distribuição é, quando: (a) v = 4; (bp = 12; (c) » = 25; (d)v =30; (o)v = 40? 
(a) = 4,60; (b) + 3,06; (0) + 2,79; (d) = 375; (e) + 2,70. 


} 
j 
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23. Uma smostra consiituído de 12 medidas de tensão de ruptura de um fio 


. de algodão apresentou a média de 7,38 kg o o desvio padrão de 1,24 kg. Deter- 


minar os limites de confiança de: (a) 95%; O) 99%, pera a tensão de ruptura wel, 


Resp: (a) 7,38 + 0,82; (b) 7,88 = 1,16 Kg. 


24. Resolver o problems procedente, admitindo-se que 08 métodos da teoria 
das grandes amostras são aplicáveis, e comparsr os resultados obtidos. 


“Resp: (a) 7,88 4 0,73; (b) 7,38 = 0,96 kg. 


35. Registraram-se os valores 0,28; 0,30; 0,27; 0,33 e 9,31 segundo, obtidos 
ein cinco medições do tempo de reação de um indivíduo æ certo estímulo, Deter- 
minar os limites de confiança de: (a) 95%; (b) 99%, para o tempo wal de reação. 

Resp.: (a) 0,298 + 0,030; (b) 0,298 = 0,049 segundo. 


26. A vida média das lâmpadas elétricas produzidas por um, compenhia 
ere, anteriormente, de 1120 horas, com'o desvio padrão de 125 horas. Uma 
amostra de 8 lâmpadas, extraída recentemente de ume série há pouco fabricada, 
apresentou vida média de 1070 horas. Tester o, hipótese da vida média das 
lâmpadas não ter se alterado, adotados os níveis de significância.: (a) 0,05; (b) 0,04. 

Resp.: Um teste bilateral mostro que não há evidência, tanto no aível 0,05 
como no 0,01, que indique que è vida médis foi alterada. 


27. No problema anterior, testar & hipótese js = 1 120 horas em compara- 
ção com à alternative. m < 1 120 boras, adotados os níveis de significância: (a) 
0,05; (b) 0,01. 

Resp: Um teste unilateral indica que não há decréscimo da média em 
ambos os níveis. 


— 28. As especificações parè & produção de corta liga exige 23,2% de cobre. 
Uma amostra, constante de 10 anglises do produto, apresentou o teor médio de 
cobre de 23,5% e o desvio padrão de 0,24%. Pode-se concluir, nos niveia de 
significância: (a) 0,01; (L) 0,05, que o produto autistas às espacificog exigidas ? 


Resp: Um teste bilateral, em ambos os niveis, indica que o produto não 
satisfaz às especificações exigidas. 


29. -No Probl. 28, tester a hipótese dò teor médio do cobre ser superior 

ao exigido pelas especificações, adotados os níveis de significância: (a) 0,01; (b)0,05 ? 
Resp: Um teste unilateral, em ambos os níveis, mostra que 6 teor médio 

de cobre é superior ao das especificações. E É 


-i so. Um perito eficiente declara que, mediante à introdução de um nòvo 
tipo de maquinaria no processo de produção, pode ser substancialmente diminuído. 
ò tenpo necessário pare 2 produção. Por causa do custo decorrente da manu- 
tenção das máquinas, a administração percebe que, à não ser que o tempo de 
produção possa ser reduzido de, pelo menos, 3%, não se poderá dispor de recursos 
para introduzir O processo. Seis experiências realizados indiesm que o tempo 
de produção é reduzido de 8,4%, com o desvio padrão 0,32%. Adotados os níveis 
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qe significância: (a) 0,03; (b) 0,05, tester a hipótese de que o processo deveria 
i usido. 


Aiid, se o nível de sigoificàveis adotado fôsse 0,0], mas que o.seria-se fôsse 
adotado o nível 1,05, 


51, Mediante o emprêgo de gasoline da merea 4, o número médio de qui- 
iômeiros por litro, perconidos por 5 automóveis semelhantes, em condições idênti- 
289, foi de cora o desvio padrão 0,4: ndo-se a de marca B, aquêle núme- 
zo médio foi de 21,4, com o desvio padrão 0,54. Escolhido o nível de significância 
3,05, investigar se a marea 4 é realmente melhor do que a B, por proporcionar 
maior quilometragem por litro. 


Resp.: Um teste uvilaterai indica que s marca À é melhor do que a 8, no 
nível de significância, 0,05. 


32. Dois tipos do solução química, A è B, foram ensoindos para a deter- 
minação doa pH (grau de acidez da solução). As análises de 6 amostras de À 
indicata o pří médio de 7,52, com o desvio padrão de 0,024. As de 5 amostras 
de 8 apresentaram o pR médio de 7,49, com o desvio padrão 0,032. Adotado o 
nível de significância 0,05, determiner ss os dois tipos de solução têm valores 
diferentes de př. 

Resp: Medisnte o eraprêgo de um, teste bileteral, no nível de significância 


2,05, não se concluiris, cora base nas amostras, que hg diferença de acidez entre 
oa dois tipos de solução, 


53. Em um exarae de psicologia, 12 estudantes de ums turma tiveram o 
grau médio 78, comro-desvio padrão 6, dó passo que 15 estudantes ds dutra turma. 
tiveram o grau médio 74, còm o desvio padrão 8. Adotado o nfvel de significância 
9,05, determiner se o primeiro grupo é superior so segundo. 

Resp: Mediante o emprêgo de um teste unilateral, no nível de significância 
9,05, concluir-se-iz que o primeiro grupo não é superior a0 segundo. 


Para uma distribuição de qui quadrado com 1Z graus de liberdade, 
determinar o valor de xe de modo que: (a) a drea à direita de xe? seja igual e 
9,05; (b) è ársa à esquerdo, do Xo? saja igual s 0,98; (c) a área à direito de xo 
seja igual a ipa 

Resp: (a) Bi; (È) 2827 (0) 28,3. 


db. Determinar os valores críticos de x’, para os quais a área de extremi- 
dade da » da distribuição de x? será igual æ 0,05, quando os números de 
graus de Tiberdado, p, lorem iguais a: (a) 8; (b) 19; (e) 28; (4) 40. 

Resp: (0) 15,5; (b) 30,4; (c) 41,3; (0) 55,8. 


Sé, Resolver o Probl. 18, quando a área de extremidade ds direita fôr 
igual a 0,01. 


Resp: (o) 20,1; (b) 36,2; (c) 48,3; (d) 68,7. 


“Um testo unilateral indica que o processo não deveria ser intros - 
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37. (o). Determinar x1? e X7, de modo que a área subtendida pela distri- 
„ buição de x?, correspondente a» = 20, entre Xi? è LA seja igual a 0,95, admi- 
^ tindo-se que as áreas à direita de x? e à esquerda de x)? são iguais. (b) Mostrar 
que, se não fôr admitida a hipótese o áreas iguais do item (a), os valores de x? 
e x? não serão únicos. ý 

Resp.: (a) 9,59 e 34,2. 

38. Se a variável U apresenta uma distribuição de qui quadrado, com 
v = 7, determinar xi? e Xg de modo que: (a) PriU > x£} = 0,025; (b) Prf U < 
< xél= 0,50; (0) Prix? £ U Sx?) = 0,90. 

‘Resp: (e) 16; (b) 6,35; (c) admitidas Áreas iguais nas duas extremidades 
xÈ = 2,17 e x? = 14,1. 

39. O desvio padrão das durações de 10 lâmpadas elétricas produzidas por 
uma fábrica é de 120 horas. Determinar os limites de confiança de: (a) 95%; 
(b) 99%, pera o desvio padrão de tôdas as lâmpadas fabricadas pela companhia. 

Resp.: (a) 87 a 280,9; (b) 78,1 a 288,5 horas. 

40. Resolver o problema anterior, quando 25 lâmpadas elétricas apresen- 
tarem o mesmo desvio padrão de 120 horas. 

Resp.: (a) 95,6 a 170,4; (b) 88,9 a 190,8 horas. 


4l. Determinar: (a) xaos; (b) xo ss para p= 150. 
| Resp: (a) 122,5; (db) 179,2. 


42. Determinar: (a) xo 0: (d) Dem para » = 250, 
-Resp.:..(a) 207,7; (b) 295,2... 


43. Mostrar que, para grandes valores de v, uma boa aproximação para x? 
é dada por (v + zp Vi), em que- zp é o percentil de ordem p da distribuição 
normel reduzida. 

44. Resolver o Probl, 39, mediante o emprêgo de uma distribuição de 22, 
quando uma amostra de 100 Kunpades elétricas apresentar o mesmo desvio padrão 
de 120 horas. Comparar os resultados com os obtidos pelos métodos do Capítulo 9. 

Resp.: (a) 106,1 a 140,5; (b) 102,1 a 148,1 horas. 


45. Qual é o intervalo de confiança de 95% do Probl, 44 que tem ampli- ` 
tude mínima? 
Resp.: 105,5 a 139,6 horas. 


46. Aveliou-se em 240 kg o desvio padrão das tensões de ruptura de certos 
cabos produzidos por uma companhia, Depois de ter sido introduzida uma mu- 
dança no processo de fabricação dêsses cabos, -as tensões de raptura de uma 
amostra de 8 clementos apresentaram o desvio padrão de 300 kg. Investigar à 
significância do aumento aparente de variação, adotados os níveis de significân- 
cia: (e) 0,05; (b) 0,01. 

Resp: Com base na amostra dada, o aumento aparente de variação não é 
significativo em quaiquer dos níveis. 
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47. O desvio padrão das temperaturas anuais de uma cidade, durante um 
e) periodo-de 100 anos, foi de 16°F. Considerada à temperatura média do 15.º dia 
“de cada mês, durante os últimos 15 anos, avaliou-se sia 10°F o desvio padrão 


menos variável do que no passado, adotados os-níveis de significância: (a) 0,05; 
(b) 0,02. . 


Resp: O decréscimo aparente é significativo no nível 0,05, mas não no 0,01. 


“dás temperaturas anuais. Testar a hipótese da températura ter se tornado 


CarituLo 12 


O TESTE DE QUI QUADRADO 


Fregiiências observadas e teóricas 


Como já foi acentuado algumas vêzes, os resultados obtidos por 
meio de amostras nem sempre concordam exatamente. com os teóricos 
esperados, de acôrdo com as regras de probabilidade. Por exemplo, 
embora considerações teóricas permitam esperar 50 caras e 50 coroas, 
quando uma moeda honesta. fôr lançada, 100 vêzes, é raro que êsses 
resultados sejam obtidos exatamente. 


Suponha-se que, em uma, Tabela 12.1 
determinada amostra, observou- 
se que um conjunto de eventos Evento 
possíveis, Zi, Es En.. Ep 
(veja a Tabela 12.1), ocorreram — Pregiiência 
com as frequências 01, 03, 03, =; “observada 
ox, denominadas frequências ob- — Fregiôncia 
servadas, e que, de acôrdo com esperada | 4 | ez | esj.. & 
as regras de probabilidade, es- 
perar-se-ia que elas ocorressem 
com as frequências é ên ey...» 6 denominadas fregüências es- 
peradas ou teóricas. i 


Deseja-se, frequentemente, saber se as frequências observadas 
diferem, de modo significativo, das esperadas. No caso de serem 
possíveis sômente dois eventos E; e E», o que é denominado, às vêzes; 
classificação dicotômica ou dicotomia, como, por exemplo, caras e 
coróas, parafusos defeituosos ou não etc., o problema é resolvido satis- ` 
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fatôriamente por meio dos métodos dos capítulos anteriores. Neste, 


considera-se o problema geral. 
Definição de x? 


Uma medida da discrepância existente entre as fregiiências 
observadas e esperadas é proporcionada pela estatística, x? (leia-se: 
qui quadrado), expressa por: 


e)? E (02 — em)? a, o E (op — ex)? = 
êz ek 
eb) 
em que, quando a fregiiência total é N, 
Eo = Èg =N. ; (2) 
Uma expressão equivalente a (1) é (veja o Probl. 11): 
É N. (3) 


Quando x? = 0, as frequências teóricas e observadas concor- 
dam exatamente; enquanto que; quando x? > O,isso não se dá. 


Quanto maior fôr o valor de x?, maior será a discrepância, entre as - 


frequências observadas e esperadas. 
A distribuição amostral de x? será, cora muita aproximação, 
uma de qui quadrado, da forma: 


Y = Yao ENO = Yox” ee (4) 


(já considerada no Capítulo 11), quando as freqtênciss esperadas 
forem, pelo menos, iguais a 5,. melhorando a aproximação para, 
valores maiores. 


O número de graus de liberdade v é dado por: 


(a) v=k— 1, quando as freqüências esperadas puderem ser 
calculadas, sem que se façam estimativas dos parâmetros populacio- 
nais, à partir do estatísticas amostrais. Note-se que se subtrai 1 de 
k, por causa da condição de restrição (2) que estabelece que, sendo 
conhecidas (k — 1) freqiiências esperadas, a remanescente pode ser 
determinada. 


"Teste de qui quadrado para a prova de aderência 


e 
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(o) v=k-— 1 — m, quando as freqüências esperadas- sômente 
podem ser calculadas mediante a estimativa de m parâmetros popu» 
lacionais, a partir de estatísticas amostrais. 


Testes de significância 


Na prática, as fregiências esperadas são calculadas com base 
em uma hipótese Ho. Se, para essa hipótese, o valor de x, calculado 
por meio de (1) ou de (3), fôr maior do que alguos valores críticos 
(tais como Xass OU Xos que são os valores críticos nos níveis 
de significância 0,05 e 0,01, respectivamente), concluir-se-á que as 
fregúências observadas diferem, de modo significativo, das esperadas 
e rejeitar-se-á Ho no nível de significância, correspondente. No caso 
contrário, dever-se-á aceitá-la ou, pelo menos, não a rejeitar. Esse 
processo é denominado teste de qui quadrado da hipótese ou significância. 

Deveria ser assinalado que se deve encarar com suspeita as cir- 
cunstâncias em que X? é muito próximo de zero, porque é raro que 
as frequências observadas concordem muito bem .com às esperadas. 
Para examinar essas situações, pode-se determinar se o valor calculado 
de x? é menor do que-Xão Ou do que Xoo CM cujos casos 
decidir-se-á que a concordância é muito boa nos níveis de significância 
0,05 e 0,01, respectivamente. ` 


O testo de qui quadrado pode ser usado para determinar quão 
aproximadamente ss distribuições teóricas, como a normal, a binomial 
ete., se ajustam às distribuições empíricas, isto é, as obtidas por meio 
dos dados amostrais (veja os Probls. 12 e 13). 


Tabelas de contingência 


A Tabela 12.1, na qual as freqüências observadas ocupam uma 
tinha única, é denominadá tabela de simples entrada. Como o número 
de colunas é k, ela é também denominada tabele de 1 X k (leia-se: 
“1 por k”), Mediante a ampliação dessas idéias, chega-se a tabelas 
de dupla entrado ou de hX k, nas quais as frequências observa 
ocupam k linhas e k colunas. São denominadas tabelas de contin- 


gência. : 
Em uma tabela de contingência de AX k, em correspondência 
a cada frequência observada; há uma esperada ou teórica, que é cal- 
culada, para as mesmas hipóteses, de acórdo com as regras de proba- 


o 
o) 
pa 
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bilidade. Essas frequências, que ocupam as casas de uma tabela de- 


contingência, são denominadas fregiiências das casas. A frequência 
total de cada linha ou. coluna Zé denominada fregiiência moiginal. 


Para investigar a conco 
e esperadas, calcula-se a estatís 


, (5) 


em que é considerada a soma de tôdas as casas da tabela de contin- 
gência e os simbolos 0; e e representam, respectivamente, as fre- 
qüências observadas e esperadas da casa de ordem j. Essa soma, que 
é análoga à da expressão (1), contém hk têrmos.. A soma de tôdas 
as frequências observadas é representada por Ne é igual à de tôdas 


“as frequências esperadas [compare com a Eq. (2)]. 


Como anteriormente, à estatística (5) tem uma distribuição 
amostral dada com muita aproximação pela expressão (4), desde que 
as frequências esperadas não sejam muito pequenas. O número de 
graus de liberdade, v, dessa distribuição de qui quadrado é dado, 
para h> 1 e ED 1, por: 


(a) v=(h-1)(k— 1), quando as frequências esperadas podem 
ser calculadas sem que se-tenha de estimar os parâmetros popula- 
cionais por meio 'das estatísticas amostrais. Uma prova é o Probl. 18. 


(b) v= (k — 1) (k= 1)— m, quando as frequências esperadas 
sômente podem ser calculadas mediante a estimativa de m parâmetros 
populacionais, por meio das estatísticas amostrais. 

Os testes de significância, para as tabelas de A X k, são seme- 
lhantes aos para as tabelas de 1 X k. As fregiiências esperadas encon- 
tram-se sujeitas a uma hipótese particular Ho. Uma hipótese comu- 
mente admitida é que as duas classificações são. independentes uma 
da outra. i 

As tabelas de contingência podem ser ampliadas para maiores 
dimensões. Por isso, por exemplo, pode haver tabelas de à X k Xl, 
nas quais estão presentes 3 classificações. 


à po oe To apia E 
Correção de Yates para a continuidade . 


Quando os resultados referentes a distribuições contínuas são, 
aplicados a dados discretos, podem ser feitas certas correções relativas 
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cia entre as frequências observadas 


co 
ò 
SA 


à continuidade, como se verifica nos capítulos anteriores. Dispõe-se 
de correção semelhante, quando fôr utilizada a distribuição de qui 


quadrado. A correção, consiste em transformar a expressão (1) em: 


doe 
ez 


x? (corrigido) = 


e é freguúentemente denominada correção de Yates. Há, também, 


uma modificação análoga para (5). 

Geralmente, faz-se a correção sômente quando o número de graus 
de liberdade é v = 1. Para grandes amostras, essa correção produz, 
prâticamente, os mesmos resultados que o x? não-corrigido, mas 
podem surgir dificuldades nas proximidades dos valores críticos (veja 
o Probl. 8). Para pequenas amostras, nas quais cada freqliência 
esperada está compreendida entre 5 e 10, é talvez melhor comparar 
ambos os valores de X?, O corrigido e o não-corrigido. Se ambos os i 
valores conduzirem à mesma conclusão, quanto a uma hipótese, como 
sua rejeição no nível 0,05, raramente serão encontradas dificuldades. 
Se êles conduzirem a conclusões diferentes, poder-se-á recorrer ao 
aumento do tamanho da amostra; ou, se isso fôr impraticável, pode- 
vão ser empregados os métodos exatos de probabilidade que envolvem 
a distribuição polinomial do Capítulo 6. 


Fórmulas simples para cálculo de x? 
Podem sor deduzidas fórmulas simples para o cáleulo de x°, 
que envolvem sômente as frequências observadas. Apresentam-se, a 


seguir, os resultados para tabelas de contingência de 2X2 e 2X 3. 


TABELAS DE 2 X 2 


ET (a F (ay + bilar + a) (Dr + ba) = Ni N: Na Ng’ o 


na qual A = ab: — ab, N =a ta tb tby Ni= art bis 
No= qa Hb, Na =a tay Ng = bi + be (veja o Probl. 19). 
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Com a correção de Yates, essa expressão torna-se: 


“Nabo — ab, | — EN)? 
(a + by) (ax + bo) (ay + aa) (bi +05) 
Mal 


x? (corrigido) 


(8) 


Totais 


Ñ az? vb but 
E RA PE 
Na ' Ng LN: + No 


(9) 


em que “se adotou o “resultado geral, válido para, tôdas as tabélas de À 


contingênci ias: 


Go) 


Totais Ni No 


oi o Probi. 43. O resultado dá expressão (9), para as tabelas 
de 2X k, em que k > 3, pode ser generalizado (veja o Probl. 46). 
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Coeficiente de contingência 


— Uma medida do grau de afinidade, associação ou dependência 
das classifitações de uma tabela de contingência, é dada por: 


Catar an 
que é denominado coeficiente de contingência. Quanto maior fôr o 
valor de C, tanto maior é o grau de associação. O número de linhas 
è colunas da tabela de contingência determina o valor máximo de C, 
que nunca é maior do que 1. Se o número de linhas e colunas de uma 
tabela de contingência é igual a k, o valor máximo de Č é dado por 


a/e — jk (veja Probls. 22, 52 e 53). 


Correlação de atributos 


Como as classificações de uma tabela de contingência descrevem, 
muitas vêzes, as características de indivíduos ou de óbjetos, elas são 
fregiientemente referidas coino atributos, e seu grau de dependência, 
associação ou afinidade é denominado correlação dos atributos. Para 
uma tabela de k X k, define-se: 


"E NNE 


como o coeficiente de correlação entre os atributos ou classificações. 
Õsso coeficiente tem valor entre O e 1 (veja o Probl. 24). Para as 
tabelas de 2X 2, na qual k=2, a correlação é frequentemente de~- 
nominada correlação tetracórica, 


O problema. geral da correlação de variáveis numéricas é tratado 
no Capítulo. 14. 


Propriedade aditiva de x? 


Suponha-se que os resultados de experiências repetidas produ- 
zitam valores amostrais de X°, dados por X3?, X2, Xs”, +- <, COM Py 
va, vs.. graus de liberdade, respectivamente. Então, o resultado 
de tôdas essas experiências pode ser considerado equivalente a um 
valor de x? dado por X1? + xe? + Xs? + ..., com + va + ds E 
graus de liberdade (veja o Probl 25). 
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Problemas Resolvidos 


a s 


O -testide qui quadrado 


) . š e E 
$ wi 200 lances de uma moeda, observaram-se 115 caras e 
85 coroas. Testar a hipótese da moeda ser honesta, adotados os níveis 
de significância: (a) 0,05; (b) 0,01. 
Solução: 
As frequências observadas de caras e coroas são 0| = 115 e oz = 85, respec 
, š 


tivamente. 


As frequências esperadas de caras e coroas, quando a moeda é verdadeira são 
em 100 e ez = 100, respectivamente. . 
Então: 


= Lanal  lor me? (U5 — 100) 4 485 — 100%} 


x? 
a E 100 io — = 450. 


Como à número Ene tegori ri 
ema „de categorias ou classes (caras. coroas) é k = 2, p= k = 1 = 
(a) O valor crítico xs y y i í 
ríti 95» para 1 grau de liberdade = 3,84. Então, vis 
que 4,50 > 3,84, rejoitar-se-& a hipótese da moeda ser honesta, no nível pará 


ficância 0,05. ei 


(b) O valor crítico de X0,09, para I grau de liberdade = 6,33. Então, 


vis ue 4,50 < 6,63, não pode rejeitar a hipótese da moeda ser honesta, no 
to que 4,50 < 6,63, não se pode-rej > 
Je sig ia 0,01, j RE 


Jonelui-se que os resultados observados s; ificativos e 
Q de ' ju é 

E são provâvelmente significati 
que a moeda é provâvelmente viciada. é 


Para comi ção déste mu o eror É di 
paração este método com os ant me) sados, veja-se o 
; y dê do c os am nte , vej: 


2 Resolver o Probl. Y, usando a correção de Yates. 


Solução: 


eg (corrigido) = Cor = est 0.5% + (oz zelo 


e ez 
n LUIS — 100] a 0,5% (185 = 100] — 0,52 _ (14,5) , (14,5) 

100 100 = 0 + go + 4205. 
. Visto “que 4,205 > 


É Próbi. 384 e 4,205 < 6,63, as conclusões encontradas para o 


Para ų 


Résolver o Probl. 1, empregando o ajustamento da curva 
normal à distribuição binomial. 


» válidas. 


& comparação com os métodos anteriores; veja-se o Probi. 3. 
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Solução: 
. Para a hipótese da moeda ser honesta, a média e q desvio padrão do número 
de caras, esperado em 200 lances de uma moeda, são: y = Np = (200) (0,5) = 
= 1006 6 = VNpq = (200) (0,5) (0,5) = 7,07, respectivamente. 


Í.º Método: 

115 caras cm unidades reduzidas = (115 — 100)/7,07 = 2,12. Adotado o 
nível de significância 0.05 e um teste bilateral, rejeitar-se-ia a hipótese da moeda 
ser honesta quando o escore 2 estiver fora do intervalo de — 1,96 a 1,96. Com 
o nível 0,01, o intervalo correspondente seria de — 2,58 a 2,58. Segue-se, como 
no Probl. 1, que se pode rejeitar a hipótese no nível 0,05, mas não no 0,02. 

Note-se que o quadrado do escore reduzido acima, (2,12)? = 4,50, é igual 
ao valor de x°, obtido no Probl. 1. Tisse é sempre o caso, para um teste de qui 
quadrado que inclui duas categorias (veja o Probl. 10). 


2.º Método: : 

Adotada a correção de continuidade, 115 ou mais caras é equivalente a 114,5 
ou mais. Então, 114,5 cm unidades reduzidas = (114,5 — 100)/7,07 = 2,05. 
Isso conduz às mesmas conclusões do” primeiro método. 

Note-se que o qua drado do escore reduzido é (2,05 = 4,20, em. concordância, 


com o valor de x), corrigido para continuidade mediante o emprêgo da correção | 


de Yates do Probl. 2. Ésse é sempre o caso para um teste de qui quadrado 
que. envolve duas categorias ao qual a correção de Yates é aplicada. 


4. A Tabela 12.2 apresenta as frequências observadas e espe- 
radas, ao langar-se um dado 120 vêzes. Testar a hipótese do dado 
ser honesto, adotado o nível de significância 0,05. 


Tabela 12.2 


Face 1/2 | Z3ļj4ļ5š5 jó 
Fregiiência | ; 
observada | 25 | 17 | 15 | 23 | 24 


Fregiiência 


esperada 20 | 20 | 20 | 20 | 20 | 20 


taco? (oco, dama? | focar, 


a ez Es ico 
+ = (e et -Z ae + nr pe ao Rê 
12 zi e a 448 er = 5,00. 
TE mii ge: F 


Tom 
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Como o número x categorias ou classes (faces 1, 2, 3, 4, 5, 0) é k =$, 
p= k —lm=6—1= 


O valor crítico de Em pera 5 graus de liberdade," é w “Então, visto | 


que 5 < 11,1, não se pode rejeitar à hipótese do dado sèr honesto. ` 


Para 5 graus de liberdade, xoos = 1,15, de modo que x? =5> 1,15. 


Segue-se que a concordância não é tão excepcionalmente boa, e que serie con- . 


siderada com desconfiança. 


5. Uma tabela numérica de 250 algarismos tomados a0 acaso 
apresentou a seguinte distribuição dos algarismos 0,1,2,...,9. 
Deve a distribuição observada diferir da esperada, de modo signi- 
ficativo? 


Algarismos 


Fregiiência 
observada 


Frequência 
esperada 


Solução: 


2 _ O7 — 25} , (31 — 25 (29 — 25} , (18 — 25)? 
-ma t 3 t z +t- t 
(6 = 258 | 


E 


23,3. 


O valor critico de Xo para y =k — 1 =9 graus de liberdade, é 21,7 
e 23,3 > 21,7. Portanto, . conclui-se que a distribuição observada difere de espe- 
rada de modo significativo, no nível de significância 0,01. Segue-se que alguma 
suspeita é lançada sôbre a tabela de números aleatórios. 


6. Nas experiências que Mendel realizou com ervilhas, êle 
observou 315 redondas e amarelas, 108 redondas e verdes, 101 enru- 
gadas e amarelas e 32 enrugadas e verdes. De acôrdo com sua teoria 
da hereditariedade, os números deveriam estar na proporção 9:3: 
:3:1. Há alguma evidência para se duvidar de sua teoria, nos níveis 
de significância: (a) 0,01; (b) 0,05? 
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Solução: 


O número total de ervilhas = 315 + 108 + 101 + 32 = 556. Como 03 números 
espersdos estão nå proporção 9:3:3:1 (e9 + 3 + 3 +. 1.= 16), esperaríamos; 


en (556) = 312,75 redondas e amarelas 
E (556) = 104,25 enrugadas e amarelas 
a (556) = 104,25 redondas e | verdes 


5 (556) = 34,75 enrugadas e verdes. 


Então: 
2 (315 — 812,75}. -098 104.25)? X 
312,75 104,25 
(101 — 104.25} | (32 = 8475) oa 
+ 0435, 34,75 Grao. 


Como há 4 cara borião; k = 4e o número de graus de liberdade é v = d — 1 =3, 


(a) Para y'= 3, Xo, 99 = 11,3, de modo que não se pode rejeitar a teoria, 
no nível 0,01. 

(b) Para v = 3, xi, = 7,81, de modo que não se pode rejeitar a teoria, 
no nível 0,05. z : 

Conclui-se que teoria e a êxperiênci 


estão em concordância. . 


Note-se que, para 3 graus de liberdade, XK os = 0,352 e xº = o. 470 > “0,35%. 


Assim, embork a concordância seja bos, os resultados obtidos estão sujeitos a uma 
quantidade razoável de erros amostrais. 


7. Uma urna contém um grande número de bolas de gude de 
quatro córes diferentes: vermelha, laranja, amarela e verde. Uma 
amostra de 12 bolas, retiradas da urna ao acaso, revelou 2 vermelhas, 
5 laranjas, 4 amarelas e 1 verde. Testar a hipótese da urna conter 
proporções iguais das bolas de gude de côres diferentes. 


Solução: 


Para a hipótese da urna conter proporções iguais de bolas de gude de côres 
diferentes, esperar-se-iam 3 de cada espécie em uma amostra de 12 bolas. 

Como êsses números esperados são menores do que 5, & aproximação do 
x? estará errada. Pera evitar que isso ocorra, combinam-se as categorias de 
modo que o número esperado em cada categoria seja, pelo menos, iguel a 5. 

Se se desejasse rejeitar a hipótese, combinar-se-iaro as categorias de tal 
maneira que 2 evidência contra a hipótese se apresentasse mais patente. é 
conseguido, neste caso, considerando-se as categorias “vermelha ou verde 
“laranja ou amarela”, para as quais a amostra revelou 3 e 9 bolas, respectiva» 


e 


“ 


porções 
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mente. Como o número esperado, em cade categoria, para a hipótese de pro- 
kudis é 6, tem-se: 


= 2- l=], xos = = 8,84. Em consegiiência, não se pode rejeitar 
a hipótese, no nível de significância 0,05 (embora seja possível no nível 0,10). 
Concebe-ge- que os resultados observados poderão surgir, com base na probabili- 
dade, teamo quando houver proporções iguais das côres. 


Outro método: 
Mediante o emprêgo da correção de Yates, encontra-se: 


yt = LB sl- o5 9-61-05} | (sp 285} 
06. “6 8 


= 241, 


o que leva à mesma conclusão apresentada acima. Naturalmente, isso seria espe- 
rado porque a correção de Yates sempre reduz o valor de x. 


Devet-se-ia assinalar que, se fôr usada a aproximação de x?, não obstante 
o fato das fregiiências serem muito pequenas, obter-se-ia: 
2-3? (4-3) 1-3) 


= 5 = 3% 
x= ~ + ( AR E 
3 3 3 3. 


= 3,33. 


Visto que, para v=4-1=3, Xo, os = 7,81, chegar-se-ia às mesmas 
conclusões acima, Infelizmente, a aproximação de x?, para pequenas fre quências, 
é insuficiente; por isso, quando pão é aconselhável combinar frequências, deve- 
se recorrer 808 métodos exatos de probabilidade do Capítulo 6. 


8. “Em 360 lances de um par de dados, observaram-se 74 “setes” 
u » td ; 
e 24 “onzes”. Adotado o nível de significância 0,05, testar a hipótese 
do dado ser honesto. 


Solução: 


Um par de dados pode cair de 36 maneiras. Um “sete” pode ocorrer de 6 
maneiras e um “onze” de 2, 


AtA ater a É 1 tonge” 2 1 
Então, .Pr [''sete” | = Er Pr {"onze”} = 3 = is" Por conseguin- 
te, em "360 lances esperar-se-ia — é (360) = Pon spten e ja (880)=20 “onzes”, 
I > 


- de modo ' que: 


(a 60 (= 20 
a LO agr. 
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entretanto, determina-se:- 
i PEA (irá — 60| — 0,5} (iza — 20| — 0,5 
ngh } = = nam n a efa ota aporte Bam 
x? (corrigida) “O ` SO 


Co RC 


50 ao + 88 


Portanto, com base no ad corrigido, não se poderia rejeitar a hipótese no . 


nível 0,05. 

Em geral, pera grandes amostras, como as dêste caso, os resultados obtidos 
mediante o emprêgo da correção de Yates mostram-se mais dignos de confiança 
do que os não-corrigidos. Entretanto, como até mesmo o valor corrigido de x? 
apresenta-se muito próximo do crítico, hesita-se em tomar decisões em um sentido 
ou em outro. Nesses casos, é talvez melhor aumentar o tamanho da amostra, 
procedendo-se a maior número de observações se, por alguma razão, se está espe- 
cialmente interessado no nível 0,05. Aliás, poder-se-ia rejeitar a hipótese em 
algum outro nível (como 0,10), se isto fôr satisfatório. 


9, O recenseamento. de 320 famílias com 5 crianças revelou a 
distribuição apresentada na Tabela 12.3. Psese rèsultado é compatível 
com à hipótese dos nascimentos de homens ë mulheres serem igual- 
mente prováveis? 


Tabela 12.3 


a ii aie PEPEE 

Número de 5 4 3 2 1 0 

meninos e | meninos | meninos | meninos [meninos | menino .| meninos 
meninas 2 4 5 Total 


meninas | menina [meninas | meninas | meninas | meninas 


- Número de 
famílias 


18 56 110 88 40 8 320 


Solução: 


Seja p a probabilidade de nascimento de um homem e q=} pa de uma 


mulher. Então, as probabilidades de (5 meninos), (4 meninos e 1 menina), ... > 
” (5 meninas). são dadas pelos têrmos do desenvolvimento binomial: 


(p +a) = pë + Bpa + 10p°g + 10p + Spa! + g. 


Se p= 5, têm-se: 


` 5 
Pr {5 meninos e O meninas) = (1) sh 


` Pr {4- meninos e 1 menina} = 5 ( 


asd th 


aaa 


“alto"da pág. 281, Capítulo 10. 
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Pr [3 meninos e 2 meninas) = 10 G y G 

TA. Ke ENT 

- Pr {2 meninos e 3 nshinaal = 10(5) G 
A Rec iai E a 1 

Pr {1 menino é 4 meninas) = 5 (5 ) G = 


Pr (0 meninos e 5 meninas) = (+) 


Então, os números esperados de famílias com 5, 4,3, 2, 1 e O meninos, são 
obtidos, respectivamente, multiplicando-se as probabilidades acima por 320 e 
os resultados são 10, 50,7 100, 100, 50, 10. Por isso: 


(810) | (86—50? | (10 — 100%. | 


2 a 
x 1 150 — 100 
(88 — 100 , (40 = 50} , (8—10? 
100 ta Ep a 


Como É = lile Xp = 15,1, para » = 6 — 1 = 5 graus de liberdade, 
pode-se rejeitar a hipótese no nível de significância 0,05, mas não no 0,01. Em 
consegiência, conclui-de que os resultados são provavelmente significativos e que 


-os nascimentos de homens e de mulheres não são igualmente prováveis. 


10. Demonstrar que um teste de qui quadrado, que envolve 
apenas duas categorias, é equivalente ao teste de significância do 


Solução: 

Se P éa proporção da amostra para a categoria 1, p a proporção populacional 
e N à fregiiência. total, pode-se descrever a situação por meio da tabela anexa. 
Então, por definição: 


I n Total | 
Fregüência observada, NP NG — P) N 
Freqtiência esperada | Np | NG —p) = Ng i N 


nto WENI. NONO ar 


Np Ng 
WP y VEP oye- pfl 
me mp (d+) 
NP- Pro, 
ki py pain 


que é o quadrado da estatística z da pág. 281. 


. .. Sob a forma: 
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E. ae Crea OESTE 


iz, (a) Provar que a fórmula (1) da pág. 331 pode, ser escrita 


(b) Usar o resultado do item (a) para verificar o valor de X’, 
calculado no Probl. 6. 


Solução: 


E E RR, DOT À 
(a) Por definição, x? = E (o; 2 >y (x Porti te ) nã 
3 S: 


2 2 1 2 
«DL 2 + By = DL NAN =R N, 
e; A e; e; 


em que se usam os resultados (2) da pág. 381. 


(3152 , (108) 


AND F (101) 
Oo say N = 3215 1025 


+ 104,25 


+ 


+ — 550 = 0,470. 


Prova de aderência , 


12. Dar o Rene de qui quadrado pará efetuar a E pIóva, do 
aderência dos dados do Probl. 31 do Capítulo 7. 


Solução: « 


(88 882 | (144—1619) , (342—3162). | (287 — 308,7} | 
e Taa 161,9 316,2 308,7 


150,7 29,4 E Hii 


Como o número de parâmetros usados para a. avaliação das fregüências espe- 
radas é m = 1 (a saber, o parâmetro p da distribuição binomial), » = k — | — 
-m=6-1-1=4. 


Então, o ajustamento dos dados é bom. 


Para v = 4, Xi; = 9 
- Para v = 4, Xiop = OTI Em consequência, como x? = 7,54 > 0,711, `o 
` ajustamento não é tão bom quanto se acreditava. 
13. Realizar a prova de aderência dos dados do Probl. 33, 
Capítulo 7. 


E TS 


ESTATÍSTICA 


Solução: 


418? (18 — 20,68} pe =S802p (gr = rip 


T413 20,68 ` 88,92: - “Tan + 


Girat 
+ TAS = 0,950. 


Coma o;número de parâmetros usados para a avaliação das frequências espe- 


radas é m = 2 (a saber, a média u e o desvio padrão o da distribuição normal), 
V= k l m = 5—12 Hl a2, 


Para d = 2, Né = 5,99. Em consegiiência, conelui-se que o ajustamento 
dos dados ¢ muito bom. 


Pars p = 2, Kise = 0,103. Então, como x? = 0,959 > 0,103, o ajustamento 
não é “demasiadamente bom”. 


Tabelas de contingência 


14. Resolver o Probl. 20 do Capítulo 10, mediante o emprêgo 
do teste de qui quadrado. 
Solução: 
` Ås condições do problema estão apresentadas na Tabela 12.4(a). Para a hipó- 
tese nula, Ho, do sôro não produzir efeito, esperar-se-ia que 70 pessoas de cada 
grupo ficassem curadas e que 30 não, como está indicado na Tabela 12.40). 


Note-se que Ho é equivalente a estabelecer-se que a cura é independente do uso 
do sôro, isto é que as classificações são independentes. 


Tabela 12.44), Fregiiências observadas 
Curados| Não Total 
curados 
ese frescor) 


Jori Grupo À N 
: . (usando o sôro) 75 25 i 100 
a ` Grupo B ` 
* +: (não usando o sôro) 65 35 1 100 
3 un 


Total 40 6u 200 
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Tabela 12.4b). Fregtências esperadas sob Ho. 


Curados|) Não 
2 curados 


Grupo À 
(usando o sôro) 


Grupo B 
(não usando o sôro) À 


“Total 


2 (15 — TOP, (66 702 | (25 — 30} | (36 = 30} , 
x=o tom. tog fo 208 


Para determinar o número de graus de liberdade, considere-se a Tabela 12:5, 
que é igual às anteriores, com a diferença de sômente estarem indicados os totais. 
É claro que se tem a liberdade de colocar apenas um número, em uma das quatro 
casas vazias, visto que, feito isso, os das casas remanescentes são deduzidos dos 
totais indicados. Em consegiiência, há um grau de liberdade. 


“Tabela 12.5 


Outro método: 


Pela fórmula (veja o Probl. 18), v=(h-D)(k-D=(2-D(2-1)=1, 

Como Xoos = 3,84, para 1 grau de liberdade, e que X? = 2,38 < 384, 
conclui-se que os resultados não são .significativos no, nível 0,05. Portanto, não 
se está habilitado a rejeitar Ho nesse nível, e conclui-se que o sôro é ineficaz ou, 
então; deixa-se a decisão pendente de testes ulteriores. 


Note-se que x? = 238 é o quadrado de escore z = 1,54, obtido no 


. Probl. 20 do Capítulo 10. Em geral, o teste de qui quadrado, que envolve as pro- 


porções amostrais de uma tabela de contingência de 2 X 2, é equivalente a um 
teste de. significância de diferenças de proporções, mediante o emprêgo de um 
ajustamento normal, como na pág. 282 do Capítulo 10 (veja o Probi. 20). 
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* é o quadrado 'do êscore 2, segue-se que X é, nesse caso, igual æ z. Por isso; & rejei- - 


» 


Note-se. também que um teste unilateral, com o emprégo de x°, é equiva- 
jente a um bilateral que emprega apenas X, por exemplo, xº > Roe: corres- 
ponde a (x > Xogs) ou a (x < — Xog). Como, pata as tabelas de 2X2; x? 


“ ção de uma hipótese no nível de 0,05, utilizando-se 2, é equivalente .à rejeição, 


em um teste unilateral, no, nível 0,10, usando-se 2, 


15. Resolver o problema anterior, mediante o emprêgo da 
correção de Yates: 


Solução: 


? 2 (175 -70| — 0,5) (165 — 70] — 0,5) 
x? (corrigido) = 70 + 70 + 


(125 — 30] — 0,5} , (135 — 30] — 05} 
Em + E = 1,98. 


+ 


Em consegiiência, as conclusões obtidas no problema anterior são válidos. 
Isso poderia ter sido constatado imediatamente, mediante a observação de que 
as correções de Yates sempre diminuem o valor de x°. 


16. Na Tabela 12.6 estão indicados os números de estudantes 
aprovados e reprovados por 3 instrutores: Sr. X, Sr. Ye Sr. Z. Testar 
a hipótese das proporçies de estudantes reprovados pelos 3 instru- 


. tores serem iguais, 


ape 


Tabela 12.6. Fregiiências observadas 


Aprovados 
Reprovados 5 14 | 8 2 
Total 55 


Solução: 


Para a hipótese Ho das proporções dé reprovados pelos três professôres serem 
as mesmas, deveriam ser reprovados 27/180 = 15% dos estudantes e, portanto, 
seriam aprovados 85%. Nesse caso, o Sr. X, por exemplo, teria reprovado 15% 
dos 55 estudantes e aprovado 85% dêles. Às fregiências esperadas, para Ho, estão 
indicadas na Tabela 12.7. É 


RE tAE i 348. 
Sa l l pe 
Tabela 12.7. Fregiiências esperadas sob Ho 
Sr. Y r Sr. z Total 
R | 85% de 55 | 85% de 61 | 85% de | i 
Aprovados | Cos | 6,85 | =5440 | 158 
Reprovados 15% So Ad na 27 
pre: dis = a ETE 
Total 55 61 64 180 
Tabela 12.8 
Sr. X 
Aprovados 
Reprovados 
Total 
Então: . 
2 6046,75} | (4 5LBSP | (56 54,40 
xX = 46,75 51,85 54,40. 
62825} , (4915 | (89,608 
E 8,25 $ 9,15 + 9,60 so dita: 


Para determinar o número de graus de liberdade, considere-se a Tabela 12.8, 
igual às anteriores, mas na qual sômente os totais estão indicados. Ñ claro que 
se tem a liberdade de colocar spenas um número dentro de uma das casas vazias 
de primeira coluna e um em outra da segunda ou da terceira coluna, depois do 
que todos os números das cases remanescentes serão deduzidos ùnicamente dos 
totais indicados. Em consegiiência, há neste caso dois graus de liberdade. 


Outro método: 
Pela fórmula, v.= {k — 1)(k—- 1) = (2 —1)(3 — 1) = 2. 


Visto queis = 5,99, não se pode rejeitar Ho no nível 0,05. Note-se, 
entretanto, que, como po = 4,61, pode-se rejeitar Ho no nível 0,10, se se 
estiver disposto a aceitar o risco de êrro, com uma probabilidade em 10. 


ESTATÍSTICA 


17. Usar a fórmula (9) da pág. 336, para calcular o valor de 
oblema anterior. 


Temiso q = 50, do = 47, as = 56, bi = 5, ba = B u= 8 Nac atat 
Has = 153, Ne = by + b+ ba = 27, Ni = a F bi = 55, No = ar +b = 61, 
NM = a, Eba = 64, N = Na + Np = Ni t Na + Ny= 180. 
Então: . x 


no A fat at at] NT e la 
Xe Nam tmtm] alm tmtm] 


50}? 2 No » > am - 
jo É q, of | + Im [e e Ur, (8% E 


Li 


55 6l 64 27 55 “ol 64 
180 = 4,84. 
18. Mostrar que, para uma tabela de contingência de h X k o 
número de-graus de liberdade é(h — 1) (k — D, em que $ > 1,k >l. 


E 


Solução: 


Em uma tabela de À linhas e k colunas, pode-se deixar de lado um único 
número de cada linha e coluna, visto que êle pode ser facilmente" deduzido dos 
totais conhecidos de cada coluna e linha, Segue-se que se tem s liberdade de 
colocàr, apenas (h, — 1)(k — 1) números na tabela, sendo os outros automàtica- 
mente determinados de uma só maneira, Portanto, o número de graus de liber- 
“dade € (h — 1) (k — 1). Note-se que-êsse resultado prevalece, contanto que sejam 
conhecidos os parâmetros populacionais necessários para a obtenção das fre- 
qüências esperadas. 


19. (a) Provar que, para a tabela de contingência de 2 X 2, 
apre esentada com a designação 12.9(a): 


E N (ab — sa adb)? 
NNN Ng 


„Tabela 12.9(4). Resultados observados 


ERR I u Total 
ÀA a as N. A 
CARAS eu q 
B bi by NB 
Total Ni No NO 


e en RS See Hha i 


: s 
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@) Exemplificar o resultado obtido no item (a), com referência 


aos dados do Probl. 14. 


Tabela 12.9(b). Resultados esperados 


I 1 ro | 


m + 


A MN IN NaN aih | Na 


B i NIN BIN ESA No 


Total s Nr Na w 


Solução: 


Como no Probl. 14, os resultados esperados, para uma hipótese nula, 
estão indicados na Tabela 12.9), 


Então, i 
(a — NINAN? , (on = NiNaNY. Or NiNBINY. y 
t= ONNAN PO NaNaiN NIN BIN 
(do = NN BIN} , 
+ NSIN 
Mas, 
NNA (atb) lata) (bem abr, 
r EE ET Fi 
Semelhantemente, 
Es NNB am NaNe) 
(= EA) (2) e e 
ý l abr m abi ) > 
“são também iguais a o 


Portanto, pode-se escrever: 


~ ab Nº 
N N aba — azb; y N ( oba ~ ambi ) + 
X.= MNA ( N t RNa N 


N ado — abi y ESA N ( ab: 
Pons ON NaN 


que se simplifica em 
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.No Probi, 14, 01=75, a= 25, 6=65 b=35 N 
+ 5, » bo=35, Ni = 140, No = 60, 
Wa = 100, Ng = 100 e N = 200; então, como ge obteve anieriotente:: 
x? = 200 1675) (85) — (25) (65)? 
= Y7 "(140)(60) (100) (100) - = 288. 
Usando 2 correção de Yates, o reaultedo é igual so do Probl. 15:- i 
x? (corrigido) = TUe: — adi] — Ny 
NNN ANg 
 200U(75X35) — (2565)! — 100]? 
(140) (60) (100) 100) RDS: 
20. Mostrar que um teste de qui quadrado, que envolve duas 
proporções amostrais, é equivalente a um de significância da diferen- 


ga das proporções com o emprêgo do ajustamento normal j 
qr (veja a 


Solução: 


Sejam Py e Pz as proporções amostrais e p a i 
; popul l i 
so Probl. 19, tem-se: ? pulacionsl. Com referência 


(à) Pi = Ny Pa = alNo 1 — Pr=biNy 1 — Pr = bfNa 
(2) p = NaN, i — p = q = NBN 
de modo que . 
ce MP ag = NPs, by = NA = Pa), de= NA — Pa) 
(4) Na = Np, Ng = Ng; 
Mediante o emprêgo de (3) e (4), tem-se, no Probl, 19: 
ye = Mendo ab MM PANA — Po) — NPN (1 — Po)? 


ANN AN B NiNeNpNq i 
a NNa (Pi — Pa o Pp — Po i 
Npq PAUN EUN PWEN = Ni + No), 


que é o quadrado da estatística * apresentada na pág. 281. 
Coeficiente de contingência 


21. Determinar o coeficiente de contingência, para os dados da 
tabela de contingência do Probl. 14. 


Solução: 


= gl a = 
= e Vaso = VOI = 0,1084. 
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22. Determinar o valor máximo de C, para a tabela de 2 x 2 
do Probl. 14. 

Solução: 

o valor máximo de C ocorre quando as duas classificações são perfeitamente 


dependentes ou associadas. Nesse caso, todos os que tomaram o sôro foram curados 
e todos os que não o tomaram não o foram. A tabela de contingência aparece, 


então, como a designada por 12.10. 


há Tabela 12.10 


Não 
. Curados curados Total 
j a AEA 
f Grupo À 
S (usando o sôro) 100 0 100 
| Grupo B 
$ (não usando o sóro) 0 100 100 


Total -100 100 200 


Como as freqüências esperadas das casas, consideradas comipletamente inde- 
pendentes, são tôdas iguais a 50, 


(100 = 502 , (0-50 , (0—50 , (00-50 _ ; 
2 = a E 
Res 50 Foo ts 50 300: 


Então, o valor máximo de € = V5C/0C + N) = vVŽ00/200 + 200) = 
= 0,7071. 
Em geral, para a dependência perfeita, em uma tabela de contingência cujos 
números de linhas e colunas são, ambos, iguais a k, as únicas-casas de frequências 


não-nulas aparecem nà diagonal que vai da casa superior esquerda à" inferior 
$ direita da tabela. 


Para êsses casos, Cmax = V(k — Dk (veja os Probls. 52 e 53). 


Correlação de atributos 


28. Para a tabela do Probl. 14, determinar o coeficiente de 
correlação: (a) sem; (b) com a correção de Yates. 


ESTATÍSTICA ” 


Solução: 


t) Conto X? = 2,88, N =200 e k=2, tem-se r'='4 


=.0, 1091, o que indica correlação inuito pequena entre a cura e o uso do sôro. 


6) No Probl, 15, r (corrigido) = 4/1,93/200 = 0,0982. 


24. Provar que o coeficiente de correlação para as tabelas de ` 


contingência, definido pela €q. (12) da pág. 337, está compreendido 
entre 0 e 1. 


Solução: 


Pelo Probl. 53, o valor máximo de Hx? F N) é VE Ijk. Então: 


kÈ S (k= DO AN, ROSIE HKN — N, 


X? S (dk —1)N, ES žia NEEN ED A 
Nú =D Na- É 1 


Como xê = 0, r 2 0. Então, O Sr S1, como se estabeleceu. 
Propriedade aditiva de x? 


25. Para testar uma hipótese Ho, uma experiência foi reali- 
zada três vêzes. Os valores resultantes de x? foram 2,37, 1,86 e 3,54, 
cada um dos quais corresponde ao grau de liberdade um. Mostrar 
que, apesar de Ho não poder ser rejeitado no nível 0,05, com base 


em cada experiência individual, ela poderá sê-lo quando as três expe- 
riências forem associadas. 


Solução: 


O valor de x2, obtido mediante a associação dos resultados das três- expe- 
riências é, de acôrdo. com s propriedade aditiva: 


x? -= 2,37 a 2,86 +3,54 = 9,77, como 14+1+1=3 graus de liberdade. 


Como Xa og Para 3 graus de liberdade, é 7,81, pode-se rejeitar A no nível 
d 
le. significância 0,05. Mas, como E é o; = 3,84, para 6 grau de liberdade uni- 
tário, não sp pode rejeitar Ho, com base em qualquer das experiências. 


Ao associar experiências, cujos. valores obtidos para x? correspondem. ao 


grau de liberdade unitário, omite-se a correção de Yates, por causa de sua ten- 
dência de super i i 


i 
| 
| 
i 
| 
ji 
! 
Í 
4 
Ai 


Problemas Suplem ementares 


O teste de qui quadrado 


26. Em 60 lances de uma moeda, observaram-se 37 caras e 23 coroas. Testar 


“a hipótese da moeda ser honesta, adotados os níveis de significância: («) 0,05; 


(b) 0,01. 


> Resp.: A hipótese não pode ser rejeitada em nenhum dêsses níveis. 


27: Resolver o Probl. 26, usando 9 correção de Yates. 


Resp.: A conclusão é igual à anterior. 


28. Durante um longo período de tempo, os graus dados por um grupo de 
instrutores de um curso particular foram, em média, 12% de A, 18% de B, 40% 
de C, 18% de D e 12% de F. Um nôvo instrutor atribuiu 22% de 4, 34% de 
B, 66% de C, 16% de D e 12% de F, durante dois semestres. Determinar, no 
nível de significância 0,05, se o nôvo instrutor está seguindo o padrão de graus 
estabelecido pelos outros. 

Resp.: O nôvo instrutor não está seguindo o padrão de graus dos outros. 


(O fato dos graus serem melhores do que a média, pode ser atribuído à maior habi- 
lidade de ênsino ou & padrões de -julgamento inferiores ou a ambos os casos.) 
` 


29. Três moedas foram lançadas, num total, de 240 vêzes, e de cada vez 
foi anotado o número de caras obtido. Os resultados estão indicados na Tabela 


12:11, juntamente com os esperados, para & hipótese das moedas serem honestas, - 


Testar esta hipótese, no nível de significância 0,05. 


Resp.: Não há razão para rejeitar a hipótese das moedas serem honestas, 


Tabela 12.11 


O caras | 1 cara | 2 caras | 3 caras | 


Fregiiência ; 
observada Re 28 
esperada 


l 
Freqüência 30 a 30 


-50. O número de livros emprestados por uma biblioteca pública, durante 
uma determinada semana, está indicado na Tabela 12.12. Tester a hipótese do 
número de livros emprestados não depender do dia da semana, adotados os níveis 
de significância: (a) 0,05; (b) 0,03, 


Resp: Não há razão para rejeitar a hipótese em qualquer dos níveis 
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Tabela 12.12 


Número de livros 


emprestados, 185º 108 120 14 k 146 


31. Uma urna contém 6 bolas de gude vermelhas e 3 brancas. Selecionam- 
se dessa urna, ao acaso, duas bolas, anotam-sc suas córes e restituem-se-as à urna. 
Ésse processo 6 realizado num total de 120 vêzes eos resultados obtidos estão in- 
dicados na Tabela 12.13. (a) Determinar as fregúéncias esperadas. (b) Determinar. 
no nível de significância 0,05, se os resultados obtidos estão de acórdo com os 
esperados, 


Resp.: (a) 10, 60 e 50, respectivamente. (b) A hipótese dos resultados se- 
rem iguais gos esperados não pode ser rejeitada, no nível de significância 0.05. 


Tabela 12.13 


2 vermelhas 
O brancas 


1 vermelha 
1 branca 


O vermelhas 
2 brancas 


Número de 
retiradas 


53 61 


32, 200 parafusos foram selecionados, ao acaso, da produção de cada uma de 


` 4 máquinas, Os números de parafusos defeituosos encontrados foram 2, 9, 10 e 3. 
- Doterminar se há uma diferença significativa entre as máquinas, adotado -o-nível 


de significância 0,05. 
Resp: A diferença é significativa no nível 0,05. 


Prova de aderência 

33. (a) Usar o teste de qui quadrado para determinar à prova de aderência 
dos dados do Probl. 75, Capítulo 7. (b) É o ajustamento “muito bom” ? Adotar 
o nível de significância. 0,05. 

Resp.: (a) O ajustamento é bom. (b) Não. 


54. Usar o teste de qui quadrado pare determinar a prova de aderência 
dos dados referidos no: (4) Probl, 77 do Capítulo 7; (b) Probl. 78 do Capítulo 7. 
Adotar o nível de significância 0,05 e, em cade caso, determinar se o ajustamento é 
“muito bom”. 

Resp: (a) O ajustamento é “muito bom”. (b) O ajustamento é “fraco” 
no nível 0,05. 

35. Usar o teste de qui quadrado para determinar a prova de aderência dos 
dados aludidos no: (a) Probl. 79 do Capítulo 7; (b) Probl. 80 do Capítulo 7. 
O resultado obtido no item (a) está de acôrdo com o do Probl. 33? 

Resp.: (a) O ajustamento é muito “fraco” no nível 0.05. Como a distri- 
buição binomial proporciona um bom ajustamento dos dade 
coerente com o do Probl. 33. (b) O ajustamento é bom ma 


êsse resultado é 
ão “miuito bora” 


Segunda Têrça | Quarta | Quinta |; Se | 


“as duas classes. Resolver o problema a 
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- 86. A Tabela 12.14 indica os re- Tabela 12.14 
sultados de uma experiência para in- 
vestigar os efeitos da vacinação de a i Não 
animais de laboratório contra uma roses adoéçes 


enfermidade particular. Adotados os ram 
niveis de significância: (a) 0,01; (b) mms | 
0,05, testar. a hipótese de não haver 


n Vacinados | 9 42 
diferença entre os grupos de vaci- ă RE: a Ds 
s É É é 
nedos e não-vacinados, isto é, de Não. a a 
serem independentes & vacinação e a siácinados 7} 
eufermidade. : E sais 


Resp.: A hipótese pode ser rejeitada no nível 0,05, mas não no 0,01. 


37. Resolver o problema anterior, usando a correção de Yates. 


Resp.: Mesma conclusão. 


38. A Tabela 12.15 mostra o nú- Tabela 12.15 


mero de estudantes de cada uma das 
Hasta 


duas classes, A e B, aprovados e re- 
provados em um exame feito em am- 
bas. Adotados os níveis de signifi- eme 
cânecia: (a) 0,05; (b) 0,01, testar & hi- Classe A 
pótese de não haver diferença entre 


com e sem a correção de Yates. 
Resp.: A. hipótese não pode ser rejeitada em nenhum dos níveis. 


39. A um grupo de doentes que se queixavam de não dormir bem foram 
dadas, a alguns, pílulas soporíferas, enquanto que aos outros forem dadas pílulas 
de açúcar (embora todos pensassem ter recebido as soporíferas). Perguntou-se - 
lhes, depois, se as pílulas os ajudaram ou não. O resultado de suas respostas está 
indicado na Tabela 12.16. Admitindo-se que todos os doentes disseram a verdade, 
testar a hipótese de não haver diferença entre as pílulas soporíferas e as de açúcar, 
no nível de significância 0,05. 

Resp.: A hipótese não pode ser rejeitada no-nível 0,05. 


Tabela 12.16 


Dormiram 
bem 


Tomaram pílulas 44 10 
soporíferas 

Tomaram pílulas ai 35 
de açúear 


f 
| 
i 
i 
i 
g 
i 


“de autòmóve 


358 = È 


40. Sôbre feer to projeto de interêsse nacional, grupos de Democratas e Repu- 
«dolicarios votaragr como está indicado na Tabela 12.17. Nos níveis de significância: 
(a) 0,01; (b) 0,05) testar a hipótese de não haver diferen entre os dois partidos, 
era relação a $Hp projeto. 

Resp: A hipótese pode ser rejeitada em. ambos os níveis. 
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Tabela 12.17 


Indecisos | 


A favor Contra 


Democratas 85 78 37 


Republicanos 318 25 


41. A Tabela 12.18 mostra a relação entre os aproveitamentos dos estulantes 
em matemática e física, Testar a hipótese do aproveitamento em física ser inde- 
pendente do de matemática, adotados os níveis de significância: (a) 0,05; (b) 0,01. 


Resp: A hipótese pode ser rejeitada em ambos os níveis. 


Tabela 12.18 


Matemática 


Graus altos 56 71 12 
Física | Graus médios 47 163 38 
Graus baixos 14 42 85 


42. Os resultados de um levantamento realizado para determinar se a idade 
do motorista (de 21 anos ou mais) tem algum efeito sôbre o número de acidentes 
h que esteja envolvido (inclúídos todos os acidentes secundários) 
“Tabela 12.19. Nos níveis de significância: (a) 0,05; (b) 0,01, 
do número de acidentes ser independente da idade do motorista. 
veis de dificuldades das técnicas amostrais, bem como outras 
poderiam afetar as conclusões? 


estão indicado 
“testar a hipóte: 
Que fontes p: 
considerações, 


Resp: As Rinótese näo pode ser rejeitada em nenhum dos níveis. 
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Tabela 12.19 


idade do motorista 


a pes pa ic 
21 — 30 [a-u 4l -—50 | 51—60 ann 

9 821 786 720 sm 

Número 1 7 o f 66 60 
de E E é E Ni ER pasar hd 

5 ; 

acidentes 2 31 25 22 16 18 

mais do que 2 9 10 6 õ 7 
DO O O E ad 


43. (a) Provar que X? = Bart) — N, para tódas as tabelas de contim- 
gência, sendo N a fregiiência total de tôdas as casas. (b) Utilizando o resultado 


` obtido no item («), resolver o Probl. 41. 


44. Se Nie Nj representam, respectivamente, a some das frequências da 
ordem i e da coluna de ordem j de uma tabela de contingência (frequências margi- 
nais), mostrar que a freqüência esperada para acesa pertencente n essas linhas 
e coluna é NiÑ;/N, sendo N a frequência total das casas. 


` 45. Demonstrar a fórmula (9) da pág. 336. (Sugestão: Utilizar os resultados 
dos Probls. 43 e 44.) 


46. Estender os resultados da fórmula (9) da pág. 338 às tabelas de contin- 
gência de 2 X k, nas quais k>a 


47.. Demonstrar a fórmula (8) da pág. 336. 


48. Por analogia com as idéias explanadas para as tabelas de contingência 
de h X k, discutir as tabelas de contingência de À X k X 4, spontando as possíveis 
aplicações que cias podem ter. 


Coeficiente de contingência 


49. A Tabela 12.20 mostra a relação entre as côres dos olhos e dos cabelos 
de ums amostra de 200 estudantes. (a) Determinar o coeficiente de contingência 
sem è com a correção de Yates. (b) Comparar os resultados do item (a) com q 
coeficiente máximo de contingência. 


Resp.: (a) 0,3863, 0,3779 (com s correção de Yates). 
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E 


Côr dos cabelos 


r ~ Tabela 12.20 
Louros `| Não-louros 
Côr Azul 49 25 
dos f. e 
olhos . 
Não-azul 30 96 


50. Determinar o coeficiente de contingência para os dados de: (a) Probl, 36; 
(L) Probl, 38, sem e com a correção de Yates, 


Resp.: (a) 0,2205, 0,1985 (corrigido); (b) 0,0872; 0,0738 (corrigido). 
51, Determinar o coeficiente de contingência para os dados do Probl. 41. 
Resp.: 0,4651, 

a 52. Provar que o coeficiente máximo de contingência, para uma tabela de 


3x3, é E = 0,8165, aproximadamente, 


53. Provar que o coeficiente máximo de contingência, para uma tabela de 
k Xk, é V(k — Dyk, 


Correlação de atributos 


54. Determinar o coeficiente de correlação para os dados da tabela de 
Probl. 49. 


Resp.: (a) 0,4188, 0,4082, com a correção de Yates. 


55. Determinar o cocticiente de correlação, para os dados das tabelas do: 
(a) Probl. 36; (b) Probl. 38, sem e com a correção de Yates. 


Resp.: (a) 0,2281, 0,2026 (corrigido); (b) 0,0875, 0,0740 (corrigido). 


56. Determinar o coeficiente de correlação entre os graus de matemática e 
fisica da tabela do Probl. 41. 


Resp.: 0,3715. 


57. Se C éo coeficiente de contingência, para uma tabela de kX k, eré 
S ji f pe 
o coeficiente de correlação correspondente, provar que r = C/V (1 > G9(k — 1). 


cr 


Propriedade aditiva.de x? 


58. Para testar uma. hipótese Ho, realizou-se uma experiência 5 vêzes. 
valores resultantes de x?, cada um correspondente a 4 graus de liberdade, sã 


9,1; 8,9; 7,8; 8,6, respectivamente. Mostrar que, apesar de Ho não poder ser 


rejeitado, no nível 0,05, com base em cada experiência considerada separadamen- 
te, ela poderá ser rejeitada, no nível 0,05, com base nas experiências associadas, 
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AJUSTAMENTO DE-CURVAS E 
O MÉTODO DOS MÍNIMOS QUADRADOS 


Relação entre variáveis 


Com muita fregiiência, na prática, verifica-se que existe uma 
relação entre duas (ou mais) variáveis. Por exemplo: os pesos dos 
adultos do sexo masculino dependem, em certo grau, de suas alturas; 
as circunferências de círculos dependem de seus raios; e a pressão 
de uma determinada massa de gás depende de sua temperatura e 
de sey volume, ` 


Deseja-se, frequentemente, expressar essa relação sob forma 
matemática, por meio do estabelecimento de uma equação que ligue 
as variáveis. 


Ajustamento de curvas 


Para auxiliar a determinação de uma equação que relacione as 
variáveis, um primeiro passo consiste em colecionar dados que indi- 
quem os valores correspondentes das variáveis consideradas. 

Por exemplo, admita-se que X e Y representem, respectivamente, 
a altura e ò pêso de adultos do sexo masculino. Então, uma amostra 
de N “indivíduos” apresentaria as alturas Xi, Xas ..., Xy e os pesos 
corrêspondêntes É RD PNR do : 


`. Ume segunda etapa consiste em locår os pontos (Xa, Y3), 


(Xa, Ya), -; (Xw, Yn) em um sistema ce coordenadas cartesianas. O 


conjunto de pontos resultante é denominado, às vêzes, diagrama 
de dispe 
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No diagrama de dispersão é possível, frequentemente, visualizar 
uma curva regular que se aproxime dos dados. Essa curva é deno- 
minada de ajustamento. Na Fig. 13-1, por exemplo, os dados pare- 
cem estar bem próximos de uma linha reta, e diz-se que há uma 
relação linear entre as variáveis. Na Fig. 13-2, entretanto, embora, 
exista uma relação entre as variáveis, elá não é daquele tipo e e, então, 
é denominada relação não-linear. 

O problema geral da determinação das equações de curvas que 
se acomodem a certos conjuntos de dados é denominado ajustamento 
de curvas. 


x ; 
Fig. 13-1 Fig. 13-2 


Equações das curvas de ajustamento 


Para fins de referência, relacionamos abaixo vários tipos comuns 
de curvas de ajustamento e suas equações. Tôdas as letras, exceto 
X e Y, representam constantes. As letras X e Y referem-se, fres 
qüentemente, a variáveis independentes e dependentes, respectivamente, 
embora, êsses papéis possam ser permutados. 


G) Y= aa + aX Linha reta 

(2) Y =a t nX + ax’ Parábola ou curva 
- do 2.º grau 

(3) Y = a + aX + aX? + aX? Curva de 3.° grau 


(4) F = at aX + aÃ! + ação + aX! Curva do 4.º grau 
6) Y =at aX +a? t... PaA” Curva don. grau. 


Os segundos membros das equações acima são dènominados 
polinômios do 1.º, 2.º, 3.º, 4.º, e enésimo graus, respectivamente. 
As funções definidas pelas quatro primeiras destas equações são, 
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às vêzes, denominadas funções linear, quadrática, cúbica e do 4.º grau, 
respectivamente. 

Como outras equações: póssíveis Caire muitas), usadas na 


i prática, mencionam-se as seguintes: 


© Y= a ou p=a+mX Hipérbole 
(7) FY = ab? ou Dg Y = loga + (log b) X = 
= Go -+ aX Curva exponencial 
(8) Y = aX? ou log Y = loga +blogX Curva geométrica 
(9) =a +g Curva exponencial 
modificada 
(10) Y = aXt+ gq Curva geométrica 
si modificada 
(1) Y = pg?” ou log Y = log p + b* logg = 
= ab +g Curva de Gompertz 
(12) Y = p” +h Curva de Gompertz 
, modificada 
(13) Y = EN ou 5 = ab +g Curva logística 


(14) Y = ao + as (log x) t az (log 2)’. 


Para decidir qual a curva a adotar, é conveniente a obtenção 
de diagramas de dispersão das variáveis transformadas. Por exem- 
plo, se o diagrama de dispersão de log Y em função de X apre- 
sentar uma relação linear, a equação terá o aspecto da (7), enquanto 
que, se o de log Y em função do log X indicar relação daquele tipo, 
a equação terá a forma da (8). Para facilitar êssé processo, empre- 
ga-se, frequentemente, papel especial para gráficos, no qual uma ou 
ambas os escalas são logarítmicas. São denominados papéis semilog 
ou log-log, respectivamente. 


Método de ajustamento de curva a mão livre 


Pode-se usar, frequentemente, critério individual, para traçar 
uma curva de ajustamento que se adapte a um conjunto de dados. 
É o denominado método de ajustamento de curva a mão livre. Se 
é conhecido o tipo de equação dessa curva, é possível" obter suas 
constantes, mediante a escolha de tantos pontos da curva quantas 
são as constantes da equação. Por exemplo, se a equação é de 
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-são necessários três. 
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uma linha reta, são necessários dois pontos; se é de uma parábola, 


O método teve a desvantagem de observadores 
diferentes obterem curvas e equações diferentes. 


A linha reta 
O tipo mais simples de curva de ajustamento é a linha reta, 
cuja equação pode ser escrita: 
Y=do + aX. (15) 
Dados dois pontos quaisquer (Z, Y,) e (Xz, Y) dessa reta, as 


constantes a e a podem ser determinadas. A equação resultante 
da reta pode ser eserita: 


r-r- (%5) a-m 


ou Ê (16) 
r-Ye=em(XÔX), 


y = Y ) y A 
em que m = £ -F é denominado coeficiente angular (ou decli 
go Al 


vidade-da-reta)- e representa a variação de Y, dividida pela. corres- . 
pondente de X. À 
Quando a equação está escrita sob a forma 5), a constante 


“a é o coeficiente angular m. A constante Qo que é o valor de Y 


quando X = 0, é denominada ordenada à origem (ou intercepção no 
eixo dos Y). 


O método dos mínimos quadrados 


Para evitar o critério individual na construção de retas, parábolas 
ou outras curvas de ajustamento. que se adaptem ao conjunto de 
dados, é necessário instituir uma definição da “melhor reta de ajus- 
tamento”, da “melhor parábola de ajustamento” ete. 

Para conseguir uma definição possível, considere-se a Fig. 13-3, 
na qual os dados estão representados pelos pontos (X4, Y1) (Xz, Yo)» 
co (Xn, Yn) Para um valor dado de X, por exemplo Xi, haverá 
uma diferença entre Y; e o valor correspondente determinado na 
curva C. Como está indicado na figura, representa-se essa diferença 
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por Di, que é, muitas vêzes, designado como desvio, êrro ou resíduo 


ticia com 'os valores de X,,...; Xm, óbtém-se os desvios 


se 


Cpo Pp) 
D; ki # 
Wi 
o © 
Ep Yp Ir $ $ 
Dio” Da 
rp 
Tr Tx 
X X Zy 
Fig. 13-3 


Uma medida da “qualidade do ajustamento” da curva C aos 
dados apresentados (aderência) é proporcionada pela quantidade 
D + D; +... + Dy. Se ela é pequena, o ajustamento é bom; 
se é grande, o ajustamento é mau. Portanto, pode-se adotar a seguinte: 

Definição: De tôdas as curvas que se ajustam a um conjunto 
de pontos, 'a que tem a propriedade de apresentar o mínimo valor de 


2 2 
Di +D, +... +Dy 
é denominada a melhor curva de ajustamento. 

Diz-se que uma curva, que apresenta essa propriedade, ajusta 
os dados ho sentido dos mínimos quadrados e é denominada curva de 
minimos quadrados. Em consequência, uma reta que apresenta essa 
propriedade é denominada reta de minimo quadrado, uma parábola, 
é parábola de minimo quađrado ete. : 

É costume empregar-se a definição acima quando X é a variável 
independente e Y é a dependente. Se X fôr a variável dependente, 
a definição será modificada, considerando-se os desvios horizontais 
em vez verticais, o que corresponde a uma troca entre os eixos 
dos X. Essas duas definições, em geral, conduzem a curvas 


. de mínimo quadrado diferentes. A não ser que haja especificação 
-em contrário, considerar-se-á Y como a variável dependente e X 


como a indêpendente. 


e pode ser positivo, negativo ou nulo. De. modo semelhante, em . 
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É possível definir outra curva de mínimo quadrado, mediante 
a consideração das distâncias, segundo a, normal, de cada um dos 
pontos representativos dos dados à curva, em vez das distâncias ver- 
ticais ou horizontais. Entretanto, isto não é muito frequentemente 
usado. 
A reta de mínimo quadrado 

A reta de mínimo quadrado que se ajusta ao conjunto de pontos 
(Xo Xi) (Xe Yo... (Xw, Yn) tem a equação: 

` Y =a + aX, i (18) 


em que as constantes a e a, são determinadas mediante a resolução 


- simultânea do sistema de equações: 


EY =4WN + aX , 

{ EXY = a EX + nÃX?, (19) 
que são denominadas equações normais da reta de minimo quadrado 
(18). . , F 
As constantes q e q; de (19), se fôr desejado, podem ser deter- 
minadas por meio das fórmulas: 

— (BY) (EX? — (LX) (EXP) 
rs NEXO SXF 


(20) 
— NEXY - (2X) (2Y) 
“= NEX- OX? 


As Eqs. normais (19) são facilmente. lembradas, quando se ob- 
serva que a primeira pode ser obtida, formalmente, mediante a 
soma, membro a membro, das Eqs. (18), isto é, DY = z (ag + 
+ aX) = aN + aX, enquanto que a segunda é obtida, na 
realidade, multiplicando-se, primeiramente, ambos os membros de 
(18) por X e depois somando-as, isto é, ZXY = ZX (a + a X) = 
= ÈX + glXº. Note-se que não é feita dessa forma a dedução 
das “equações normais, mas que êsse é simplesmente um modo de 
recordá-las. Para a dedução, por meio do cálculo infinitesimal, 
veja-se o Apêndice VHI. 

Note-se também que, nas expressões (19) e (20), adotou-se a 
notação abreviada £X, ZXY ete:, em lugar de: d 


N EA 
DX 2 XY; ete. 
j= j=1 


O trabalho necessário para a determinação de uma reta de mínimo 
quadrado pode, muitas vêzes, ser abreviado, por meio de uma trans- 


formação de coordenadas, s = X -K e y= Y-F.. A equação 


.da reta de mínimo quadrado pode ser escrita (veja o-Probl. 15): 


_ f Zay Buy 
v- (2 )e ou v- (EE). en. 


Ee ZXP NU 
Y=F+ Z) x. (22) 


E riem equações, é imediatamente evidente que a reta de mínimo 

quadrado passa pelo ponto (X, Y), denominado centróid 

gravidade dos dados. ia EA OR 
Se se considerar a variável X como dependente, em vez de inde: 

pendente, escrever-se-á (18) sob a forma X = by + bY. Então, os 


resultados acima prevalecem quando X e Y são permutados e ap. 
= D 


3 e Ron o por bo e by, respectivamente. A reta de mínimo 
quadrado resultante, contudo, geralmente -não é igual à aci j 
} al 
(veja os Probls. 11 e 15(d). e aa A 


“Relações não-lineares 


As relações não-lincares podem, às vêzes, ser transformadas em 
f e p r . 
lineares, mediante a transi ormação adequada das variáveis veja o 
Probl. 21) 


À parábola de mínimo quadrado 


A parabola de mínimo quadrado, que se ajusta a0 conjunto de 
pontos (X, Vo), (Xa, Yo)... (Xy, Yy), tem a equação: 


Y = as t oX + aX’, (23) 


cujas constantes Qo, Qi € 4 são determinadas mediante a resolução 
simultânea das equações: 


f 2r =N +HalX +X: 
| ZXY = UX + EX? + aX 5 (24). 
BXF = ÈX? + EX? + aX, E 


denominadas equações normais da parábola de minimo quadrado (23) 


Gab. Bo 


Pam So q E a 
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As Egs. (24) são: facilmente relembradas, quando se observar 
que elas podem ser obtidas, formalmente, mediante a. multiplicação 
da expressão (23) por 1, X e Xº, respectivamente, e a soma membro a 
membro das equações resultantes.. Essa técnica pode .ser estendida, 
para a obtenção das equações normais das curvas de 3.º grau de míni- 
mo quadrado, das de 4.º grau e, em geral, de qualquer das curvas 
de mínimo quadrado que corresponda à Eq. (5. 

Como no caso da reta de mínimo quadrado, ocorrem simplifi- 
cações para as expressões (24) quando X é escolhido de tal modo 
que ZX = 0. Também ocorrem simplificações quando se escolhem 
novas variáveis: ` 


c=X-X y= Y- 


Regressão 


Deseja-se, freqüentemente, com base em dados amostrais, 
estimar o valor de uma variável Y, correspondente. ao conhecido de 
uma variável X, Isso pode ser alcançado mediante a avaliação 
do valor de Y, a partir de uma curva de mínimo quadrado que se 
ajuste aos dados amostrais. A curva resultante é denominada de 
regressão de -Y- para X, visto. que. Y. é avaliado a partir di 


Se se desejar estimar o valor de X a partir de um atribuído a 
Y, usar-se-á uma curva de regressão de X para Y, o que importa em uma 
permutação das variáveis, no diagrama de dispersão, de modo que 
X passa a ser a variável dependente e Y a independente. Isso equi- 
vale a substituir, na definição de curva de mínimo quadrado da 
pág. 365, os desvios verticais pelos horizontais. 


Em geral, a reta ou curva de regressão de Y para X não é igual 
à de X para Y. 


Aplicações a séries temporais 


Se a variável independente X corresponder ao tempo, os dados 
representarão os valores de Y em diversos momentos. Os dados 
ordenados em relação ao tempo são denominados séries temporais. 
A veta ou curva de regressão de Y para X, neste cáso, é denominada 
de tendência e é frequentemente empregada para as finalidades de 
avaliação, predição ou previsão. 
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inaneira análoga aos de duas.” Por exemplo, pode haver 
uma relação entre as três variáveis X, Y e Z que pode ser descrita 
pela expressão: A 
f Z = a + aX + aY, (25) 
que é denominada equação linear das variáveis X , Y eZ. 

Em um sistema tridimensional de coordenadas retangulares, 
essa equação representa um plano e os pontos amostrais reais (X3, 
Ya, Z), (Xo Yn Z)... (Xy, Yy, Zy) podem “dispersar-se” em 
posições não muito distantes dêsse plano, que pode ser denominado 
de ajustamento. f 

Mediante a extensão do método dos mínimos quadrados, pode-se 
falar de um plano de minimo quadrado de ajustamento dos dados. 
Se se está avaliando Z a partir de valores atribuídos a X e Y, êle é 
denominado plano de regressão de Z para X e Y. As equações normais, 
correspondentes ao plano de mínimo quadrado (25), são dadas por: 


EZ =uN +HalX EmBY 
EXE = X + aX? + gEXY (26) 
EYZ = DY + aD XY + mr, i 
e podem ser relembradas, considerando-as deduzidas da expressão 


(25), mediante a multiplicação por 1, X e Y, sucessivamente, ea 
seguir, a soma membro a membro. 


k 


Podem. ser também consideradas equações mais complicadas do 
que a (25). Elas representam superfícies de regressão. Se o número 
de variáveis exceder a 3, perder-se-á a intuição geométrica porque, 
então, seria necessário considerar espaços de quatro ou mais di- 
mensões. Os problemas que envolveram a avaliação de uma variável 
a partir de duas ou mais outras são denominados de regressão múltipla 
e serão considerados, com inaior desenvolvimento, no Capítulo 15. 


Problemas Resolvidos 


Linhas retas Fabela 13.1 


Y Construir uma linha reta 3 
que ajuste os dados da Tabela 13.1. X | 2 35 7 9% 


(b) Determinar uma equação para y | 1 3 7 HW 1 I7 


lemas que envolvem mais de “duas variáveis podem ser ` 
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Solução: 
(a) Locam-se os pontos (2, 1), (3, 3) (5,7) (7, L), (9, 15) e (10,17) em um 
sistema de coordenadas retangulares, como o representado na Fig. 13-4. 


` Bevidente, nessa figura, que todos os 
pontos csem sôbre uma linha reta (in- 


dicada em traço interrompido). Em con- Y S 
seqiiência, uma linha reta se ajusta eza- s 
tamente os dados. mo Pá 
(b) Para determinar a equação da A 
reta, dada por: t2 P 
+ é 
é 
OD) Y=wtax, s Pá 
E 
sômente dois pontos são necessários. Se~- A 
jam escolhidos, por exemplo, os- pontos * PA 
(2, 1) e (3,3). É 


Para o ponto (2,1) X =2e Y=]. 
Substituindo-se êstes valores em (1), re- 
sulta: 


EEn EN E E x 
A as 


i Pig. 13.4 
(2) 1 = a + 241. : 

De modo semelhante, para o ponto (3,3), X = 30 Y =3 e, substituindo-se 
em (1), resulta: 

(3) 3 = ap + 3a. 

Resolvendo-se simultâneamente as Eqs. (2) e (3), ao = —3 e a = 2, ea 
equação desejada 6: P 

Y = —3 + 2X ou Y = 2X - 3. 

Corao verificação, pode-se ver que os pontos (5,7), (7,11), (9,15) e (10,17) 
também estão situados sôbre a rete. 

2. No Probl. 1, determinar: (a) Y para X =4; (b) Y para 
X=15; (Q Y para X=0; (d) X para Y = 75; (e) X para 
Y=0; (f) o acréscimo de Y correspondente ao acréscimo unitário 
de X. 


Solução: 


Admita-se que a mesme lei de correlação Y => 2X — 3 prevalece para valores 
de Xe de Y diferentes dos especificados na Tabela 13.1 do Probl. à. 

(a) Quando X = 4, Y = 2(4)— 3 = 8—3 = 5. Coro se está determi- 
nando o valor de Y, correspondente a um de X compreendido entre dois valores 


` dedos, èsse processo é denominado, frequentemente, interpolação linear- 


(b) Para X = 15, Y = 2(15) — 3 = 30 — 3 = 27. Como se está deter- 
minsndo ò valor de Y correspondente a um de X situado jora, ou no cxterico, dos 
valores dados, ésse processo é denominado, frequentemente, extrapolação tener 
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(c) PaaX=0,Y=2(0)-3=0-3=-3 OvalordeY para X = 06 
denominado ordenada à origem ou intercepção no eixo dos Y. Č o valor de Y no 
ponto em que & reta (prolongada, sc fôr necessário) intercépta o eixo dos F. 


(d) gans Y = 7,55 7,5 = 2X — 3; então, 2X = 7,5 +3 = 10,5 e X = 
= 10,5/2 


(e) Para Y = 0, 0 = 2X — 3; então, 2X =3 e X=15. O valor de X 
correspondente a Y = 0 é denominado abscissa à origem ou infercenção noeixo dos X., 

É o valor de X no ponto em que a reta (prolongada, se fôr necessário) intercep- 
ta o cixo dos X, 

(J) Se X aumenta de 1 unidade, de 2 para 3, Y aumenta de 1 para 3, com o 
incremento de 2 unidades. 


Se X aumenta de 2 para 10, isto é, de (10 — 2) = 8 unidades, Y aumenta de 
1 para 17 ou de (17 — 1) = 18 unidades. Então, um aumento de Y de 16 uni- 


dades corresponde & um Acréscimo de X de 8 unidades, ou de 2 unidades para um. 


aumento unitário de X. 


Em geral, se AY representa a variação de Y devida a uma de AX para X, 
então a variação de Y para a unitária de X é dada por: AY/ÁX = 2. É a denomi- 
nada declividade da reta e é sempre igual ao valor de as du equação Y = qq + a X. 
A constante ao é a ordenada à origem da reta (veja o item c). 


As questões acima podem também ser respondidas mediante a referência 
direta ao gráfico da Pig. 13-4, 


(a) Mostrar que a equação de uma linha reta que passa 
pelos pontos (Ly Yi) e (Xn Y) é dada: por: 


(b) Determinar a equação de uma linha reta que passa pelos 
pontos (2, — 3) e (4, 5. 

Solução: 

(a) A equação da liuharetr é (1) Y =a + aX. 

Como (Xy, Yı) pertence à reta, (2) Yı = ao + ak 

Como (X2, Fo) pertence à reta, (3) Y: = ao + Xo 

Subtraindo-se a Eq. (2) de (1), (4) Y — Yı =a, (X — Xi} 

Subtraindo-se a Eq. (2) de (3): ` 


Yo- Y; 


Ya — Yi = a(X2— X) ou m= rang A 
r= X1 


Substituindo-se êsse valor de- a; em (4), obtém-se: 


— X5), como se desejava. 
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Ys- Yı 

X”? 
viada pele letra m, representa a variação de Y dividida pela correspondente de 
X e éa declividade da reta. A equação desejada pode ser escrita sob æ forma: 


Y — Yy = m(X — Xi) 


A quantidade representada, frequentemente, de forma abre- 


(b) 1.º Método, o que utiliza o resultado do item (a). 


Em relação ao primeiro ponto, (2, —3), tem-se Xı = 2e Yı = = 3. 
Em relação ao segundo ponto, (4,5), teth-so Xe = 40 Ye = 5, 
Ya —- Yı 


Então, a declividade m = oo Xi 

desejada é: 
Y — Y, = m(X — Xi) ou Y - (~ 3) = 4(X — 2, 

que pode ser escrita Y + 3 = 4X -= 2) òu Y =4X — IL, 

2.º Método, que emprega o processo do Probl. 1d). 

A equação da linha reta é Y = ao + aX. . 

Como o. ponto (2, — 3) pertence à reta, (1) — 3 = ao + 2a 

Como o pontó (4, 5) pertence à reta, (2) 5 = ag + 4a 

Resolvendo-se (1) e (2) simultâncamonte, obtém-se a = 4,00 = — 1. 

` Então, a equação desejada é Y = — 11 +4X ou Y =4X ~1L 


4. „Dar uma narra, a à dedução feita no Probl. 3(a). 


Solução: : 


Na Fig. 13-5, indicou-se a reta que passa pelos pontos P e Q, de coordenadas, 
(Xn Yı) e (Xo, Ya); respectivamente. 
O ponto R, de coordenadas (X, Y), 
representa qualquer ponto pertencente 
a essa reta. 


Dos triângulos semelhantes, PET 
e PQS: 


RT OS 
O TP SP 


Ar 
ou PXpYy) 


Yri Push 
X-X X-X 


X 
Multiplicando-se ambos os mem- Fig. 134-5 
bros por X — X, obtém-se: 
F: — Yı 
E AERE A eu MIO ERES eN 
Y- y= 40% (X 1) 


que é 2 equação desejada da reta. 


nada à origem; 


“e é paralela: 


ESTATÍSTICA 


Note-se que cada uma des relações da expressão (1) representa a declividade m, 


; que pode crito: 


Y — Yı = m(X — X). 


ninar: (a) a declividade; (b) a equação; (c) a orde- 
Xd) a abscissa à origem da reta que passe pelos 
pontos (1, $) e (4, —1. i 


Solução: 


(a) (Xi =l, Yı = 5) e (X2 = 4, Y2 = — 1). Então: 


m = declividade = 


Q sinal negativo da declividade indica que, à medida que X cresce, Y decresce, 
como está indicado na Fig. 13-6. 


Fig. 13-6 


(è) A equação da reta é: 


Y-f=m(X-Xy)ouFP-5=-2(X-— 1) isto é, 
F-58=-2X+2 ou Y=7-2X. 
Pode-se obter também o mesmo resultado pelo segundo método do Probl. 
Bb). 


() A ordenada à origem, que é o valor de Y correspondente a X = 0, é dada 
por Y=7-2(0)=7. fisse velor pode tembém ser obtido diretamente no 
gráfico. ; . 


(d). A abscissa à origem é o valor de X correspondente a Y = 0. Substituin- 


'do-& Y = Oia Ba Y = 7 — 2X, tem-se 0 = 7 — 2X ou 2X = 7, X = 3,5. Ésse 


valor pode tembém ser tirado diretamente do gráfico. 


6. Determinar a equação da reta que passa pelo ponto (4, 2) 
Z 2X +37 =6, 
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Solução: 
* Se duas retas são paralelas, suas declividades são iguais. 
Dê 2X + 3Y =6, deduz-se 3Y =6—-2X ou Yam 2— 2/3 X, de modo 
que sua declividade é m = — 2/3. Então, a equação da rete pedida é: 
Ve Y-Yr=n(X- X) ou Y=2= — 2/3 (X — 4), 
que também pode ser escrita 2X + 8Y = lá, 


Outro método: 


Qualquer reta paralela a 2X + 3Y = 6, tem pora equação 2X 43Y me. 
Pera determinar c, fazem-se X=4e Y=2 Então, X4) +32) = c ou 
c = 14, e a equação pedida é 2X + 3Y = 14. 


7. Determinar a equação de uma reta cuja declividade: é — 4 
e cuja ordenada à origem é 16. 


Solução; 

No equação. Y = ao + aX, ao = 16 6 a ordenada à origem e m = = 468 
declividade. 

Então, Y = 16 — 4X é s equação desejada. 


8. (a) Construir uma 
linha reta que se ajuste 2308 —p- meet emma 
dados da Tabela 13.2. (b) x 1346899 NHB 


Determinar uma equação SIT 2 4 4 5 7 8 9 
para essa reta. 


Solução: 


(e) Locsm-se os pontos (1, 1), (3, 2), (4, 4) (6, 4) (8, 5), (9, 7) GL, 8) e 
(14,9) 


Fig. 137 


em um sistema de coordenadas retangulares, como o representado na Fig. 13-7. 
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Ume linhe reta que ajustes os dados é traçada q sentimento na figura. Para 


evitar e necessidade de um critério individual, veja-se a resolução do Frobl. ii, em . 


que é empregado o método dos mínimos quadrados. 


(b) Para obter a equação da linha construída no item (a), E PERR -dois 
pontos quaisquer de reta, tais como P e Q, por exemplo. As coordenadas dêstes 
pontos, tiradas do gráfico, são, aproximadamente, (0, He (12, 7,5). 


A equação de reta é V = uo -+ aX. Escolhidos os pontos (0, 1) e a2, 75) 
tem-se, respectivamente: 

G) co + (0). 

(2) = ag + 2a. 

De (i), & = 1; então, de (2), ay = 6,5/12 = 6,542, 

Por conseguinte, a equação desejada é Y = 1 + 0,542). 

Outro método: 


Y: — Yı e aible 
PY Ed fot) Flags qt — 0), 


Y— 1 = 0542XouY=1-+0,542X, 


9. (a) Comparar os. valores de Y, tirados da reta de ajustamento, 
com os dados na Tabela 13.2 do Probl. 8. (b) Qual seria o valor 
estimado para Y, correspondente a X = 10? 


Solução : 


“(a) Pèra X =]; YEPE = 152 0015 Para X3, POTE 
+ 0,543) = 2,626 ou 2,6. É 


De modo semelhsnte, podem ser obtidos os valores de Y correspondentes a 
outros de X. Representam-se por Fest os valores de Y calculados pela equação 
Y = 1- 0,542X. fezes valores éstão registrados na Tabela 13.3, juntamente 
com os dados reais da Tabela 13.2. 


Tabela 13.3 
X 6 8 9 H 14 
y 7 8 9 
Fest 59 70 86 


(b) O valor estimado de Y correspondente a X = 10 é: 


F = 1 + 0,542 (10) = 6,42 ou 6.4, 


10. A Tabela 12.4 mostra as alturas e os pesos, arredondados 
para, centímetro e quilograma de uma amostra de 12 estudantes do 
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sexo masculino, extraída ao acaso entre os do primeiro ano de um 
Colégio Estadual. (a) Construir um diagrama de dispersão dos 
dados. (b) Traçar uma reta, que se ajuste aos dados.  (c) Determinar 
a equação ds reta traçada no item (b). (d) Avaliar a altura de um 
estudante, cujo pêso conhecido é de 63 kg. (e) Avaliar o pêso de um 
estudante, cuja altura conhecida é de 168 em. 


Tabela 13.4 


Pêso X (kg) E 63 72 60 66 70 74 65 62 67 65 68 


Altura Y (cm) 155 150 180 135 156 168 178 160 132 145 139 152 


Solução: 


(a) O diagrama de dispersão, representado na Fig. 13-8, é obtido mediante 
2 locação dos pontos (70, 155); (63, 150), ..., (68, 152). 


“(b) Em linha tracejada está representada, na figura, uma reta que so ajusta 
aos dedos. Ela é uma das muitas possíveis que poderiam ser construídas, 


Aitsra (em) 


tc) Escolhem-se dois pontos queisquer de reta traçada no item (b), tais como 
Pe Q, por exemplo. As coordenadas dêstes pontos, tiradas do gráfico, são, &pro- 
ximadamente, (60, 130) e (72, 170). Então: 


Po ye 


Y X 
Ea 4 


= AA 


ESTATÍSTICA 


O 130 pg 
Y = 180 = o X TSO 


(dy Se X = 63, então Y = H (e3) — 70 = 140 om. 
(6) Se Y = 168, então 168 = DX 70, $ x= a8 e 


X = 74,4 ou 71 kg. 


A veta de mínimo quadrado 


43. Ajustar uma reta de mínimo quadrado aos dados do Probl. 8, 
adotando-se: (a) X como variável independente; (b) X como va- 
riável dependente. 


Solução: 
(a) A equação da reta é Y = ag + aX. As equações normais são: 
( BY = aN +a 2X 
EXY = EX +a EX? 


As operações realizadas para o cálculo das somas podem ser dispostas como 
na Tabela 13.5. Embora a última coluna não seja necessária para esta parte do 
problemas ele: foi acrescentada à tabela, para ser empregada no item (b). 


Tabela 13.5 


Fit 09 O> de OS it 


= 


K 
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Como há 8 pares de valores de Xe Y, N = Beas equações normais tornam-se 


“Soo + Sa = 40 
Í 560o + 5240, = 364. 


rá 
Resolvidas simultâneamente, ao = + ou 0,545; q; = mu 0,036; e & 
5 3 R 6 Pans iai 
reta de mínimo quadrado é Y = Th + ETR ou Y = 0,545 + 0,636X. 


Dutro método: 


EF) (2X?) — (EXXEXY) (40) (524) -- (56) (368) | 6 ou 0,545 


NAX? — (EX =" (629) = (667 CI 
NEXY — (ZX) (ZY) _ (8864) - GNU) (7 z 
a= pn Gr oo Cir OM 


Então, Y = a + aX ou Y= 0,545 + 0,636X, como anteriormente. 


(b) Se X fôr considerada a variável dependente e Y a independente, & eque- 
ção da reta de mínimo quadrado será X = bo -+ bY e as equações normais são: 


a = boN + b2 Y 
EXY = WEY + EP. 


Então, usando a Tabela 13.5, as equações normais tornam-se: 


to -+ 40b, = 56 
40bo + 256b; = 304, 


das quais do = — ou — 0,50, bi = > ou 1,50, 


fisses valores também podem ser obtidos das seguintes expressões: 


_ OEY- EN(ZXY) _ (56) 256) — (40) (364) (o 
E NY? — (Er? = By - qo TCA 


NEXY — (LX)(LY) (8) (364). — (56) (40) 150 


b=NSPDOP © (H20 — 40) 


Em consequência, a equação desejada da reta de mínimo quadrado é 
X = bo + biY ou X = — 0,50 + 1,50Y. i 


Note-se que, resolvida essa equação em relação a- F, obtém-se Y = + + 74 E 


ou Y = 0,332 + 0,667X, que-não coincide com a reta obtida no item (e). 


12. Representar, graficamente, as duas retas obtidas no pro- 
blema precedente. 


381 = 
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Solução: 


Os gráficos das duas linhas, Y = 0,545 + 0,636X e X = — 0,50 + 1,507, 
estão representados na Fig. 13-9. Note-se que, neste caso, as duas linhas são 
prâticamente coincidentes, o”que é um indício de que os dados são muito bem re- 


(e) Fazendo Y = 3 nº reta de regressão de X (Probl. 11), X = — 0,50 + 
+ 1,503) = 4,0. 


14. Provar que uma linha de mínimo quadrado sempre passa 
pelo ponto (X, Y). 


presentados por ums relação linear. 


y. 


X = — 0,500 + 0,507 
ou 
Y = 0,333 + 0,667X 


“Fig. 13-9 


A reta obtida no item (a) é denominada de regressão de Y para X, e é empre- 
gada para.a avaliação de Y a partir de valores atribuídos a X. A reta obtida 
no item (b) é denominada de regressão de X para Y e é empregada para a avaliação 
de X a partir de valores atribuídos a Y. 


13. (a) Mostrar que as duas retas de mínimo quadrado, obtidas 
no Probl. 11, se interceptam no ponto (X, F). (b) Avaliar o valor 
-ede Y correspondente a: X = 12: (c) Avaliar o valor-de-X--correspon- 
dente a Y = 3. 


Solução: 
y 2X 56 40 z 
Tr ; = g= Então, o ponto E, Y) deno- 


minado centróide, é (7, 5). 
A Ao) eg (7,5) pertence à ram Y = 0,545 + 0,036X vu, mais exatamente, 


Y=— +7 ix, visto que 5 = T+ Em TO. 
O ponto (7, 5) pertence à reta X = — z + žy , visto que Tara 3 +56). 
Outro método: 
As equações das duas retas são Y = £ + ix eX=-—+ Sr. 


Resolvidas simultâncamente, obtém-se X=7eY=gE 
Por conseguinte, as retas interceptam-se no ponto (7,5). 


(b) Fazendo X = 12 na reta de regressão de Y (Probl. 11}, Y = 0,545 4 
+ L 0,63602) = 82. 


Solução: 

-Caso 1. X é a variável independente. 

A equação da reta de mínimo quadrado é (1) Y = ao + aX, 

Uma equação normal də reta de mínimo quadrado é (2) BY = aN +a X. 
Dividindo-se ambos os membros de (2) por N, tem-se (3) Ë = «o + aX. 
Sibirga se (3) de (1) pode-se escrever a reta de mínimo quadrado sob a 


forma (4) Y — F = a (X — X), que mostra que ela passa pelo ponto (EP. 


Caso 2. Y éa variável independente. 


Procedendo-se como no Caso 1, com X e Y permutados e com as constantes 
a e ay substituídas por bo è by, respectivamente, verifica-se que a reta de mínimo 
quadrado pode ser escrita sob a forma: 


6) X-X =Y- Ý) 


que indica que ela passa pelo ponto (X, 
Note-se que (4) e (5) não são coincidentes, mas se interceptam em (X, Po 
15. (a) Considerando:se X-como-variável independente, mes+ 
trar que a equação da reta de mínimo quadrado pode ser escrita 
sob a forma: 


y e Je ou y={ 


Za 


emqer=X-] e y=Y-Ť 


(b) Para X = 0, mostrar que a reta de minimo quadrado do 
item (a) pode ser escrita sob a” forma: 


ÈX 
rar 4 (Se) 
(c) Escrever a equação da, reta de mínimo quadrado, correspon- 
dente à do item (a), quando Y fôr a variável independente. 
“a Verificar que as retas dos itens (a) e (c) não são, necessà- 
riamente, coingidentes. 


inad 
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Solução: 


to) A Ea” (4) do Probl. 14 pode ser escrita sob a forma y = x, em que 
LE ety=Y-F Também, da resolução simultânea das equações 
is (veja a pág. 367) tem-se: 


l NEXF (2X) ZY) _ NZ (z Du. +P) -i2 +DIBW EP) 


a= CySxI— (ES! NÈG +XY — [E (e +E 


„NZ (ey +F + Ry +2?) - {21 +N) 2u ANP) 
NÈ (a + 2X +R) — (Dz + NEY 


NBwu + NPEz + NRDy + NºKY — (Ez + NEMEy + NY] 
NÈ + 2NX Dr + NX! — [Ex + NX)? 


Mas, Bu = Mx — Z) =0 e Zy=2Z(Y-P)=0; portanto, a igualdade 
acima simplifica-se peara: 


e Nžzy + MÝ- NXY _ Bey 
1 NES ANE O NR Ba 


Jaso também pode ser escrito sob a forma: 


a Zu ( Zur =P)  Esy = PEx Loro 
= Za ra Èr? = gz 


Então, a reta de mínimo quadrado é y = az, isto é: 


y= (SE): ou y= ESD 


b) Sež=0, z=X~X =X. Então, de 
Bro. EXY 
= (Ga) o - Ge) ou y = P+ (Sa) 


Outro método: 


As equações normais da reta de mínimo quadrado, Y = a + aX, são: 
l EY = oN +ÔBbX e BXY = 0PX +a pX 
Se X = (2XYN = 0, então, EX = 0 e as equações normais tornam-se: 
EY =N e EXY = maix, 


Er zxy, 


Jonde =À == = MEn 
donde a N Y e a ZX: 


“a 


` Então, equação desejada da reta de mínimo quadrado é: 


Y =a Ha ou rez+ (E)r 


s 


AAEE 
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(c) Permutando-se Xe Y ou ze y, pode-se mostrar, como no item (a), que: 


z E) y. 
-(d) De acôrdo com o item (a), a reta de mínimo quadrado é: 
, Zr 


De acôrdo com o item (c), a reta de minimo quadrado é: 


z - (#4) ou (2) v=(SÊ)a 


3 
Como Se = Iw , em geral, as retas de mínimo quadrado (1) e (2) são 


diferentes. 
Note-se, entretanto, que elas se interceptam em z & 0 e y == 0, isto é, no ponto 
EP. 


16. SeX'=X+LA4 e Y'=Y++B,em que A e B são duas 


“constantes quaisquer, provar que: 


O NEXY = (ÈX) ÈY)  NEX'Y'— (EX)EP) 
ai NZX (EXP NX- (EX) 


q. 


„Solução: 


dx Ra IAE+A-X-E=e 
y =Y -P =(Y +B) - (7 +B8B)=Y-9=y 


Então, Za = Zero e o resultado assemelha-se ao do Probl. 15. .Um 
2 Za” 


resultado semelhante prevalece para by. 

Peste resultado é útil, porque possibilita a simplificação dos cáleulos para a 
obtenção da reta de regressão, mediante a subtração das variáveis Xe Y de cons- 
tentes adequadas (veja o segundo método do Probl. 17). 


Nota: O resultado não prevalece quando X’ =gX+4 e Y'= oY +B, 
a menos que c; = = e9 


` 17. Ajustar uma reta de mínimo quadrado aos dados do 
Probi. 10, adotando: (a) X como variável independente; db Xx 
como variável dependente. 
Solução: 
; $ = 
(o) De acórdo com o Probi. 15 (a), a reta desejada é y = (E em 
qe r=X -že y=Y-ọ. 
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As operações necessárias para o cálculo das somas podem ser dispostas como 
na Tabela 13.6. Nas duas primeiras colunas determinam-se X= = 802/12 = 66,8 
e Y =] 850/12 ='154,2. 


A última coluna foi acrescentada para ser utilizada no item (b); 


Tabela 13,6 


Pêso X | Altura Y | 2=X-X |y=Y-Y z Er Ed Pi 
70 155 32 08 2,56 1,24 0,64 
63 150 -3,8 —4,2 15,96 14,44 17,64 
72 180 52 25.8 134,16 27,04 665,64 
60 135 —6,8 =19,2 130,56 46,24 368,64 
66 156 —0,8 1,8 —1,44 064 | 324 
70 168 32 13,8 4416 10,24 190,44 
74 178 7,2 23,8 171,36 51,84 566,44 
05 160 -18 58 | —10,44 3,24 33,84 
62 132 -4,8 ~ 22,2 106,56 23,04 492,84 
67 145 Cd 02 2 — 1.84 0,04 84,064 
65 139 -18 2 27,36 3.24 231,04 
68 152 12 2 —2,64 1,44 4,84 

a a Ea 
Ex =802:Ey=1850 Ery= Zr = y= 
X=668 = 154.2 =016,82 | =191,68 | =2659,08 
Eae E 


A reta de mínimo quadrado pedida é: 
e) 616,32 
: ( 22 = 19,687 — 322 


ou Y — 154.2 = 3,22(X — 66,8) que pode ser escrito: Y = 3,22X ~ 60,9. Esta 
equação é denominada de reta de regressão de Y para X e é empregada para avaliar 
Y a partir de valores atribuídos a X. 


(b) Se X fôra variável dependente, a linha desejada será: 


Ery 616,32 
rm ( So = ossada 4 7 0282y, 


que pode ser escrita sob a forma X — 66,8 = 0,232 (Y — 154,2) ou X = 31 
+ 0,2327. 

Essa equação é denominada de rela de regressão de X para Y e é empregado 
-para avaliar X a partir de valores atribuídos a Y. 

Note-se que o método do Probl, 11 pode também ser empregado, se fôr 
desejado. 


Qutro método: 


Usando o resultado do Probl. 16, pode-se subtrair, de X e de Y, constantes 
adequadas. Subtrai-se 65 de X e 150 de Y. Então, os resultados podem ser dis- 
postos como na Tabela 13.7. 
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Tabela 13.7 
RE 
x y x" xY y2 
je 
5 5 25 25 25 
—2 0 4 0 0 
7 30 ag 210 900 
-5 —15 25 75 225 
1 6 l 6 36 
5 18 25 90 324 
9 28 81 252 784 
0 10 o 0 100 
-3 —18 9 54 324 
2 —5 4 —10 25 
0 ~ll o 0 123 
3 2 9 6 4 
7 
IX’ =.22 Ev' = 50 Ex? =232 | EX'Y'=708 | Br? = 2868 
pace as E Praca ei Gi na 


NEX'Y' = (EX) (EF) „a (12X708) — (22) (50) 


a= — FAx — (EX) azea TH 
dy = PELE = (ZPX) | QA (T08) — (MED (gago, 


NEVE (2Y (12) (2 868) — (50)? 


Como X- =65 +22/12-= 66,8 -e .Y.=.150 + 50/12 = 154,2, a8 equações de . 
regressão são Y — 154,2 = 3,22(X — 66,8) e X — 66,8 = = 0,282 (Y — 154,2), listo 
é, Y = 3,22X — 60,9 e X = 0,232Y + 3), de acôrdo com o primeiro método. 


18. (a) Em um mesmo sistema de eixos, desenhar os árida 
das duas retas do Probl. 17. (b) Avaliar a altura de um estudante, 
cujo pêso conhecido é de 63 kg. (c) Avaliar o pêso de um estudante, 
cuja altura conhecida é de 168 em. 


Solução: 


(a) As duas retas estão representadas na Fig. 13-10, juntamente com os 
pontos originais dados, Note-se que elas se interceptam no ponto (E, 7) ou 
(66,8; 154,2). , 

(b) Para avaliar Y a partir de X, use-se a linha de regressão de Y para X, 
obtida no Probl. 17, Y = 3,22X — 60,9. 

Então, para X = 63, Y = 3,22(63) — 60,9 = 142 em. 

(co) Pora avaliar X a partir de Y, usa-se a linha de regressão de X para Y, 
obtida no Probl. 17, X = 31 Ea 

Então, para Y = 168, X = 31 + 0,232(168) = 70 kg. 


ESTATÍSTICA 


Os resultados dos itens (b) e (c) poderiam ser comparados com os do Probl. 


10(d) e 109). 


Alturo (em) 


130- 


Pãso (kg) 
Fig. 13-10 
Aplicações a séries temporais 
Tabela 13.8 19. A produção de aço nos 
e Estados Unidos, em milhões de 
Produção de aço nos toneladas (1 tonelada = 1 000 
Anos 4º Estados Unidos kg), durânte os anosde 1946 a 
1 ; 1956, está indicada na Tabela 
1946 86,6 13.8. 
1947 84,9 . f 
1948 38,6 (a) Representar gràfica- 
1949 78,0 Ê 
1960 . 968 mente os dados. 
1951 ` 105,2 b D i $ ã 
ee qo (b) eterminar a equação 
1953 16 de uma reta de mínimo qua- 
1954 88,3 drado que se ajuste aos dados. 
1955 117,0 . - 
1956 152 (0) Avaliar a produção de 


aço, durante os anos de 1957 e 
1958, e compará-la com os va- 
is, de 112,7 e 85,3 mi- 


(Fonte : ” Instituto Americano 
de Ferro.e Ago) 


lhões de toneladas, respectivamente. 


(4) “Avaliar a produção dè aço, durante os anos de 1945 é 1944, 


. e compará-la com os valores reais, de 79,7 e 89,6 milhões de toneladas; 
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ttonsladas) 


Produção de aço nos E.U.A. 


E t T T T T T T T K 
156 197 1948 iam 1850 O aos 192 1953 1956 1955 1930 
Ano 


Fig. 13-1 
(b) Primeiro método: 
Ex 
Utiliza-se a equação y = (SE) emque z=X-Fey=Y- J: 


O trabalho pode ser disposto como nã Tabela 13.9. 


Tabela 13.9 


[3 
É 
SE Anos x Y z=X—X | y=Y-Y x zy 
É À Eis E n 
E = 142,0 
194 0 . 66,6 -5 28,4 25 i 
a doar 1 84,9 En —10,1 16 40,4 
E 1948 2 88,6 -3 -64 9 192. 
EA 1949 3 78,0 -2 - 170 E 840 
t 1950 4 96,8 -1 1, -4 
Sk 1951 5 105,2 0 10,2 0 0 
É 1952 6 93,2 1 -18 1 -18 
$ 1953 7 111,6 2 16,6 4 33,2 
1954 8 88,3 3 -87 9 -201 
1955 9 117,0 4 22,0 18 38,0 
1956 10 115,2 5 20,2 25 101,0 
| ZX=55 | EF =1045,4 Zr? =110 | Exy= 484,1 
X=5 Y=95,0 
a 


Ly. 434,1 
.A equação desejada, y = (58) % torna-se y = ( TIO > ou y = 83,852, 
qué pode ser escrita sob a forms: 


Y — 95 = 3,95 (X — 5) ou Y = 75,2 + 395X, 


cuja origem, X = 0, €o ano 1946, e a unidade de escale dos Xé1 ano. 


388: É ESTATÍSTICA 


O gráfico desta reta, denominada de tendência, está indicado em linha tracejada 


na Fig. 13-11, A equação é frequentemente denominada equação de tendência e 
os valores de Y calculados para os de X, » denominam-se valores de tendência. 


Segundo método: 


Atribuindo-se os valures de X correspondentes aos anos de 1946 a 1956, de 
modo que EX = 0, a equação da reta de mínimo quadrado pode ser escrita da 
seguinte forma: 

3 XY 
r= P4 (Ga) 


Como os dados so referem a um número impar de anos, pode-se atribuir X = O 
ao ano mediano, 1951, e X = 1,2, 3, 4, 5 aos anos seguintes e X = — 1, —2, —3, 
—4, —5, aos precedentes. O resultado está indicado na coluna 2 da Tabela 13.10 
e é equivalente ao emprêgo da coluna 4 da tabela do primeiro método. 


O ano mediano, 1951, é denominado origem, À não ser que haja especificação 


ao contrário, admitir-sc-4 que os valores:de Y são referidos aos do meio do ano,, 


isto é, a 1º de julho. Em conseqüência, X = Q corresponde a 1.º de julho de 1951; 
X = — 1a 12de julho de 1950 ete. Os cálculos necessários podem ser dispostos- 
como na Tabela 13.10," 


Tabela 13.10 


Anos x e q x : P é qua 

AEN E K 
1946 -5 66,6 25 ~—333,0 
1947 —4 84,9 16 —339,6 
1948 -3 88,6 9 —265,8 
1949 -2 78,0 4 — 156,0 
1950 -1 96,8 Si 96,8 
1951 0 105,2 0 0 
1952 1 93,2 1 93,2 
1953 2 111,6 4 223,2 
1954 3 88,3 9 264,9 
1955 4 137,0 16 468,0 
1956 5 115,2 25 576,0 

X =0 EY = 1045,4 | 2X = 10 | SXY= 434,1 
k Pe ja El, 


Então, F = (EYJN = 1 045,4/11 = 95, c a equação desejada é: 
F = 95 + (4341/110)X ou Y = 95 43,95%, 


cuja origem, X =Q, corresponde ao ano de 1051, e a unidade da escala dos 
X é 1 ano. 


=" car, 13 


Deslocando-se a origem para 1946, cinco anos antes, devé-se substitui por 

X — 5, obtendo-se, portanto, a equação Y =95+3,95(X — 5) ou F = 75,2 + 
* +3,95X, como no primeiro método. i 

O segundo método é superior 20 primeiro, porque o třaheiho de cálculo 

fica reduzido. Entretanto, deverá ser modificado quando o número anos, 

a que se referem os dados, fôr par. Para esta modificação, veja-se o segundo 

método do Probi. 20%). O primeiro método pode ser aplicado em todos 


os casos. 
5X, em que N = O corros- 


(e) Usa-se a equação de tendéncia Y = 95 j i à 
Então, os anos de 1957 e 1958 correspondem a X = Ge X = 7, 


ponde a 1951. 
respectivamente. 

Para X = 6; Y = 95 +3,95(0) 
real, 112,7. 

Para X = 7, Y = 95 +3,95(7) = 122,6, que não é muito semelhante ao 
valor real, 85,3, 0 que exemplifica o risco decorrente do processo de extra- 
polação. o 

Os mesmos resultados podem ser obtidos, usando-se a equação de tendência 
Y = 75,2 + 3,95X, que tem como origem o ano de 1946, fazendo-se X = H1 e 
X = 12, respectivamente. 

(d) Usando:se a linha de tendência Y = 75,2 + RISK, com S = =] e 
X = —2, acham-se os valores: 


H 


08,7%, que é muito semelhante ao valor 


V=752+395(-1) =71,2 e Y = 752 + 3,95(-2) = 67,3. 


20. A produção de cigarrilhas nos Estados Unidos, durante os 
anos de 1945 a 1954, é apresentada na Tabela 13.11. 


Tabela 13.11 


Anos [ns 1946 1947 1948 1949 1950 1951 1952 1953 1954 


y 


A di 7 SI S 
cigareilhas | 082 928 800 891 835 689 602 GL 088 012 


(milhões) 


ta) Representar graficamente os dados. 
eO Determinar a equação de uma reta de mínimo quadrado 


que se ajuste aos dados. 


(co) Avaliar a produção de cigarrilhas durante o ano de 19 


$. 
E 
Z. 
$ 
g 
3 30 ~i 
H 
E À 
É 
= 
20- 
Ü T T T OE, T T K À 
1945 1043 1947 1948 1949 1950 1951 1952 1953 1954 
j Ano 
Fig. 13-12 


(b) Primeiro método: 


Tabela 13.12 
oa 
Anos X Y ž=X- |y=Y7-Y E zy 
1945 9 98,2 —4,5 21,4 20,25 | —96,30 
1946 1 92,3 —3,5 15,5 12,25 — 54,25 
1947 2 80,0 =2,5 32 6,25 —8,00 
1948 3 89,1 -1,5 12,3 2,25 — 18,45 
1949 4 83,5 —0,5 87 0,25 —8,35 
i 1950 5 68,9 0,5 —7,9 0,25 —3,95 
1951 Te 69,2 1,5 -7,6 2,25 —11,40 
1952 7 6% 25 —9,7 8,25 —24,25 
1953 8 58,3 3,5 —18,5 12,25 —64,75 
1954 | ° 9 61,2 4,5 —15,6 20,25 | —70,20 
L 
EX = 45 | ZY = 767,8 Èr? =82,5 | Zey= 
X=45| F =7,8 = — 354,9 
Erih 1 
q é Ex ža KARE. —354, = 
lação desejada, y = (5 Ea formats y = 82,5 z o y 
“que pode ser escrita sob a forma Y — 76,8 = — £30(X — 4,5) ou 
Y = 98,2 — 4,30X, cuja origem, X = 0, corresponde so ano de 1945, e s unidade 
da escala dós X é 1 ano. i 
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O gráfico deste reta, denominada de tendência, está represeniádo era linha 


tracejada na Fig. 13-12. 


Segundo método: pa S 
Tabela 13.13 


T 
Anos x Y xt XY 
1945 98,2 81 | 
1946 92,3 49 
1947 80,0 25 
1948 89,1 9 
1949 83,5 1 
1950 68,9 { 

1951 69,2 9 
1952 67,1 25 
1953 58,3 49 


767,8 | ZX? = 330 | ZXY = —709,8 
78,8 ; i 


e remete rr aa 


Neste método, desejam-se atribuir valores a X, correspondentes aos anos, de 
modo que ZX = Q. Como há um número par de anos, não há nenhum mediano 
e não pode ser empregado o segundo método do Probl. 9. Entretanto, podem-se 
associar os números — 0,5 e 0,5 aos dois mediancs, 1949 e 1950, de modo que 
1951; 1952, ... sejam representados por 1,5; 2,5;...e 1948, 1947, ... por — 1,5; 
-— 25... f 

Esses valores correspondem, essencialmente, aos da quarta coluna da Tabe- 
la 13.12 do primeiro método. 


“Também, para evitar frações, dobram-se êsses valores, de modo a obter a 
a segunda. coluna da Tab. 13.13. Note-se que com êsses valores de X, » origem, 
X = 0, corresponde a0 meio do período entre 1.º de julho ds 1949 e 1.º de julho 
de 1950, que é 1.º de janeiro de 1950 ou 31 de dezembro de 1949. Também a 
unidade da escala dos X é a metade de 1 ano, i 
EX 


Como X = 0, a equação desejado tem s forma Y = F+ So J= que 


dá (veja a Tabela 13.13): 
Y = 76,8 + (—709,8/330)X ou Y = 76,8 — 245X, 


cuja origem, X = 0, corresponde a 1.º de janeiro de 1950 e em que X é medido 
em meios-anos. í 

Se se desejam medir os X em anos inteiros, em vez de meios, deve-se substi- 
tuir X por 2X, de modo que a equação tornasse: 

f Y = 768- 430X, 


cuja origem $ o 1.º de janeiro de 1950 e em que X é medido em anos. 


3. no ESTATÍSTICA 


Se se deseja que a origem seja o 1º de julho de 1945, deve-se substituir X por 
X — 4,5, porque há 4,5 anos entre essa data e 1.º de janeiro de 1950. 
O resultado é: o code RR PO ego RO 
Y = 76,8 — 430(X > 4,5) = 96,2 — 4,30%." 
Essa expressão concorda com & do primeiro método. : 


(c) Usa-se a equação Y = 96,2 — 4,30X, com X = 10 EEA a 
1955. Então, Y = 53,2, de modo que se pode esperar uma Produção d de 53,2 
milhões de cigarrilhas, se a tendência é prosseguir. 


Equações não-lineares redutíveis à forma linear 


21, A Tabela 13.14 dá os valores experimentais da pressão P 
de uma massa dada de gás, que correspondem a vários valores do 
volume V. De acôrdo com os princípios da termodinâmica, deve 
existir entre essas variáveis uma relação da forma PVY = C, em que 
ye C são constantes. (a) Determinar os valores de y ẹ C. (b) Es- 
crever a equação de correlação entie P e V. (c) Avaliar P para 
V = 100 polegadas cúbicas. i 


Tabela 13.14 


| Volume V em polegadas cúbicas 7 543 618 724 887 118,6 194,0 


Pressão P em libras por polegada 
quadrada 61,2 49,5 37,6 284 19,2 10,1 


Solução: 
Como PVY = C, tem-se: 
log P +ylogV = log ou logP = log — y log Y. 
Fazendo log V= X e log P = Y, a última equação pode ser escrita sob s forma: 
(1) Y = a + aX, 


em que ao -+logC e aq = y. 


A Tabela 13.15, relacions X = log V e Y = log P, correspondentes aos 
valores de V e P da Tabela 13.14 o indica, também, os cálculos necessários 
para o cálculo da reta de mínimo quadrado (1). 


As equações normais cor respondentes àquela reta Fe são: 


EY =a N +a EX e EXY = X +a DX, 
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(ZY)(2X?) — (ZX) (ZXY, EXY — 
eo PRE, NSX nr À 4,20, a = EMT = —1,40, 


Então, F = 4,20 — 1,40X. 
“Tabela 13.15 


X=logV Y = logg P x XF 
1,7348 1,7868 3,0095 3,0997 . 
1,7910 1,6946 3,2077 EEH 
1,8597 1,5752 3,4585 2,9294 
1,9479 1,4533 3,7943 2,8309 
2,0741 1,2833 4,3019 2,6617 
2,2878 1,0043 5,2340 2,2976 

ZX = 11,6953 ZY = 8,7975 ZX = 23,0059 ZXY = 16,8543 
e rs 


(a) Como a =420=lg Ce w=-140=-y C=160XI10 o 
Y = 1,40. 

(è) A equação desejada, expresse em P e V, pode serescrita sob a forma 
PYS = 16, 

(c) Para V = 100, X =logV =2 o Y= log P = ZR ~ 1,40 (2) = 1,40. 
Então, P = antilog 1,40 = 25,1 lb/po}?. 

22. Resolver o Probl. 21, mediante a. locação dos dados em 
“papel de gráfico log-log. 


Solução: : 


Yous V 
Fig. 13-13 ` 


94 ESTATÍSTICA 
Para .cada par de valores da pressão P e do volume YV, da Tabela 13.14 do 
Probl. 21, obtáfn-se um ponto que é locado no papel de gráfico log-log, de fabricação 
entado na Pig. 13-18. ky g 
bém representada uma reta (desenhada à” sentimento) que se ajusta. 
a êsses pontos] O gráfico resultante indica que há uma relação linear entre log P 
e log V, que pode ser representada pela equação: E E 


log P =a +algY ou Y= a t mX.- 


A declividade a, que neste caso é negativa, é dada, numêricamente, pelo 
quociente do “comprimento AB pelo AC (adotada uma unidade apropriada de 
comprimento). Neste caso, as medidas conduziram a a = — 1,4. 

Para obter ao, precisa-se de um ponto'da reta. Por exemplo, para V = 100, 
P = 25; tirado do gráfico. Então: 

ao =log P — alog V = log 25 + 1,4log 100 = 1,4 + (L4XB) = 42, 
de modo que: 
log P + 1,4l0g V = 42; log PV = 4,2 e PVHá = 16. 


A parábola de mínimo quadrado 


2%. A Tabela 13.16 mostra a população dos Estados Uni- 
dos, durante os anos de 1850 a 1950, com intervalos de dez anos. 
(a) Determinar a equação. de uma parábola de mínimo quadra- 
do que se ajuste aos dados. (b) Calcular os valores. de tendência, 
para os anos dados na tabela, e compará-los com os valores reais. (©) 
Avaliar a população em 1945. (d) Avaliar a população em 1960 e 
compará-la com o valor real. (e) Avaliar a população em 1840 e com- 
pará-la com o valor real (veja o Probl, 23, Capítulo 1). 


Tabela 13.16 


Anos 1850 1860 1870 1880 1890 1900 1910 1920 1930 1940 1950 


População dos . 
Estados Unidos 23,2 314 39,8 50,2 629 76.0 92,0 105,7 122,%. 131,7 151,1 
É (milhões) 


Fonte: Buroan of the Census 


Solug 


ta) Sejam X eY as variáveis que representem, respectivamente, o ano é 8 po- 
pulação que lhe corresponde. A equação de uma parábola de mínimo quadrado 
que se ajusta 203 dados é: x 


7 = a + aX + aK’, 
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em que aoar € ag são determinados por meio das equações normais. 


RS 2Y = ao N +a EX t at X? 
= (2) ZXY ao EX + a DX? + a XS 
aA EXY = ao ÈX? + a DX? + a BXA 


É conveniente que X seja escolhido de modo que o ano mediano, 1900, corres- 
ponda a X = 0 e que os anos de 1910, 1920, 1930, 1940, 1950 e de 1890, 1880, 1870, 
1860, 1850 correspondam a Ï, 2, 3, 4, 5e a —1, —2, —3, —4, —5, respectivamente. 
Com esta escolha, 5X e EX? são nulos e as Eùs. (2) ficam simplificadas. 

. As, operações necessária, pera o cálculo podem ser dispostas como ua 
Tabela 13.17, abaixo. ` 
Usando essa tabela, as equações normais (2) tornam-se: 


1lac + 110ap = 8868 
(3) 11001 = 1429,8 
. 11000 + 195842 = 9209,0. 


Da segunda equação de (3) obtém-se q = 13; da primeira e da terceira equa- 
ções, aa = 76,64 e az = 0,3974. Então, a equação desejada é: 


(4 Y = 76,644 13X + 0,3974X?, 


cuja origem, X = 0, corresponde 2 1.º de julho de 1900 e em que a unidade dos X 
éigual 2 10 anos. : 


Tabela 13.17 


EX <0 2Y = Exa | BXa=0 | BXi= | EXY = | EXP 


= 8868 | =11 = 1958 | = 1429,8 | = 9209,0 
(b) Os valores da tendência, obtidos quando se faz X = —5, —4, —3, —2, 


— 1,0, 1, 2, 3, 4, 5 na Eq. (4), estão indicados na Tabela. 13.18, juntamente com 
os valores reais. Vê-se que a concordância é boa. 


Tabela 13.18 


7 gaii E E = 
Anos {X =—5X =-— 4 X=—2 X we) Xm0 X=1] X=2| X= | X[m | X5 
$ -| 1850 1860 1880 1890 | 1900 | 1910 | 1920 | 1930 | 1940 | 1950 
Valoz da 
tendên.| 2L6 | 31,0 | 41,2 | 542 | 640 | 78,0 |.900 | 104,2 | 119,2 | 135,0] 181,6 


Val. reai | 232 314 | 39,8 | 502 | 629 | 780 | 920 | 105,7 ES [131,7 | 151,1 


"896 : Co usTaTÍisPICA 


(e) 1945 corresponde a X =45, para o qual Y = 76,64 + 1%4,5) + 
+ 0,8974(4,5)2:= 143,2, - 
= 168,9, i És 
Teste valor não concorda muito bem com o real, 179,3. 
(e) 1840" corresponde a X = —6, para o qual Y = 76,64 + 13(—6) + 
+ 0,3974 —6)? = 12,9. e 
Esto valor não concorda muito bem com o real, 17,1. 


Éste exemplo ilustra o fato de que uma relação, que se verifica que é satis- 
fotória para uma faixa de valores, não o será, necesshriamente, pare uma faixa 
mais extensa. i 


Problemas Suplementares 


Linhas retas 


24. Se 3X + 2Y = 18, determinar: (a) X para ¥ = 3; (b) Y para X = 2; 
(c) X para Y = —5; (d) Y para X= 1; (e) a abscissa à origem; (f) a ordenada à 
origem, 

Resp.: (a) 4; (b) 6; (e) 28/3; (d) 10,5; . (e) 6; (f) 9. 

25. Construir, no mesmo sistema de eixos, os gráficos das equações: 
(a) Y = 8X — 5 ()XA42Y=4 Emque ponto êsses gráficos se interceptarm ? 

Resp.: (2, 1). 

26. (a) Determinar a equação da linha reta que passa pelos pontos (3, —2) e 
“(=1,6) (0) Determinar a abscissa è a ordenada à origem da reta do item (a). 
(c) Determinar os valores de Y que correspondem a X =3ea X = 5, (d) Veri- 
ficar as respostas aos itens (a), (b) e (c) diretamente em um gráfico. 

Resp.: (a) 2X = Y = 4. (b) Abscissa à origem = 2; ordenada à origem = 4 
(c) —2, —6. 

27. Determinar a equação da linha reta, cujo coeficiente angular é 2/3 e cuja 
ordenada à origem 6 —8. j 

Resp: Y = 23X -3 ou 2X -3Y = 9. 

28. (a) Determinar o coeficiente angular e a ordenada à origem da linha, 
cuja equação é 3X — 5Y =20, (b) Qualéa equação da reta que é paralela à do 
item (a) e que passa polo ponto (2, — 1)? Pa 

Resp.: (a) coeficiente angular = 3/5; ordenada à origem = — 4. (b) 3X — 
=Y = 1 

29. Determinar: (a) a declividade; (b)a ordenada à origem; (c) a equação 
«da reta que passa pelos pontos (5, 4)e (2,8). 

Resp.: (a) —4/3; (b) 32/3; (c) 4X = 3F = 32. 

30. Determinara equação da reta cujas ordenada é abscissa à origem são 3 
o —%, respectivamente. 

Resp: X/3 + YK—5) = i ow 5X — 3Y = 15, 


(d); 1960 corresponde a X. =.6, para o qual Y = 76,64 + 13(6) -+.0,3974(6)? =. 


“o gapt j8 : 


| 
k 
É 
E 
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Sk. A temperatura de 100°C corresponde à de 212ºP, enquanto que & de 0C 
corresponde à de 32ºF, Admitindo-se que há uma relação linear entre os graus 
“Centígrados e Fahrenheit (representados por C e F, respectivamente) determi- 
“nai: (a) a equação que correlatione Ca F; (b)o grau F correspondente a 8C; 
(c) o grau © correspondente a 88°F. E 


Resp.: (a) E = 2 C +32; (b) 176ºF; (c) 20°C. 


A reta de mínimo quadrado 


32. Ajustar um, reté de mínimo quadrado aos 
dados da tabela seguinte, adotando: (a) X comova- XI|I3 56891 
viável independente; (b) X como variável depen- n 
dente. Representar gràficamente os dados e as yl23465 8 
retas de mínimo quadrado, utilizando o mesmo sis- 


tema de eixos coordenados. 


o 
Resp.: (4) Y = -4 +5X ou Y =— 0,333 + 0,714X; (DX = 1 +5 yY 


ou X = 1 +1,29 Y. 


33. Determinar, para os dados do probleran ‘anterior: (4) os valores de Y 
correspondentes a X = 5e X = 12% (b) o valor de X correspondente a Y = 7. 


Resp.: (a) 3,24, 8,24; (b) 10, 


34, (a) Use o método. a sentimento para obter a equação de uma É 
se ajuste aos dados do Probl. 32. (b) Responder ao Probi. 33, empreg; 
resultado do item (a). 


55. A tabela seguinte apresenta os-graus finais de Algebra e de Física obtidos 
por 10 estudantes, selecionados 20 acaso entre um grande grupo de estudantes. 
(a) Representar graficamente os dados. (b) Determinar a reta de mínimo qua- 
drado que se ajusta aos dados, adotado X como variável independente. (c) De- 
terminar a rete de mínimo quadrado que se ajusta aos dados, adotado Y como va- 
ziável independente. (d) Se um estudante obteve grau 75 em Álgebra, qual é seu 
grau esperado em Física? (e) Se um estudante obteve grau 95 em Física, qual é 
seu grau esperado em Álgebra ? 


Álgebra (X) 75 80 92 65 8 71 %8 


Física (Y) 82 78 86 72 o 80 95 72 89 74 


Resp.: (b) Y = 29,13 + 0,661X. (c) X = — 14,39 + L15Y. (d)79. (e) 95. 


35. A tabele seguinte apresenta o número de agricultores nos Estados Unidos 
tem milhões), durante os anos de 1949 a 1957. (a) Representar gráficamente oa 
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ainar ums reta de rafnimo quadrado que sé ajuste a essa série 
r seu gráfico. (c) Caleulsr os velores de, tendência e compará- 
(H) Avaliar o número de agricultores no ano de 1948 e compa- 
r real (10,30 milhões). (e) Pr T O número de agricultores 


.em 1958 Üo valor real é 7,53 milhões). Discutir as posaíveis.fonies de êrro nessa. 
predição.- 


Núármeio de a 296 903 955 S1j 886 861 836 7,82 7,58. 


cultores (milhõ 


Fonte: Department ol Agriculture 


Resp. (b) Y = 8,872 — 0,312X, em que F, número de agricultores (em mi- 
lhões), é expresso em função dos anos, com a origem em 1.º de julho de 1953. (d) 
10,43 milhões. (e) 7,31 milhões. 


37. O índice de preço, para os contribuintes de assistincia médica, nos Esta- 
dos Unidos, é apresentado na seguinte tabela, para os anos de 1950 a 1957. Ao 
pertodo de referência ou básico, de 1947 & 1949, foi atribuído o valor 100; que signi- 
fico, realmente, 100%. O índice para 1952, por exemplo, é 117,2 e indica que, 
durante 1952, a média dos preços de assistência médica foi de 117,2% do que pre- 
valecia no período básico, isto é, aumentou de 17,2%. 


(a) Representar graficamente os dados. 


(b) Enconivar uma reta de mínimo quadrado. que se ajuste aos dados e 
construir seu gráfico. 


(e) Calcular os valores da tendência e compará-los com os reais. 


(d) P izer o índice do preço da assistência médica durante 1958 e compa- 
rá-lo com o valor real (144,4). 


(e) Em que ano se poderá esperar que o índice do preço seja o dôbro do de 
1047 a 1049, admitindo-se que a tendência atual continua prevalecendo. 


Anos 1950 1951 1952 1953 1954 1955 1956 1957 


Índice de Preço para 
os contribuintes da 


assistência médica 106,0 341,1 J17.27121,3 125,2 128,0 132,6 138,0 


(1947-194 100} 
Fonte: u, of Labor Statistics E < 

“Resp: 00) F = 12242 4 210X, se a unidade de X fôr 1/2 ano e se a origem 
fòr 1º de janviro de 1954, ou Y = 107,09 + 3.38X, se a unidade de X fôr Lano 


e se a origem fôr 1º de julho de 1950. (d) 142,1. (e) 1971. 
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Curvas de mínimo quadrado 


38. Ajustar uma parábola de mínimo quadrado Y = eo + aX + aX? sos 
dados da tabela abaixo. 


x 0 1 2 3 4 5 8 


r| 24 2 82 56 93 14,6 219 


Resp: Y=551+32(X-3)+0733(X — 8) ou Y = 25 — 12X + 
+ 0733X? 

39. O tempo total necessário para que se faça um automóvel parar, depois de 
perceber-se um perigo, é composto do tempo de reação (decorrido entre o reconhe- 
cimento do perigo e a aplicação dos freios) e do tempo de freagem (necessário 
para s parada, depois de aplicação dos freios). A seguinte tabela dá as distâncias 
de parada D (ém pés) de um automóvel que desenvolve as velocidades V (mph), 
no instante em que é avistado o perigo. (0) Representar graficamente as variá- 
veis De V. (b) Ajustar uma parábola de mínimo quadrado, da forma D = aq + 
+ aV + aV? aos dedos. (c) Avaliar D para V = 45 mph e 80 mph. 


Velocidade V 


Distância para parada D 54 90 138 206 292 396 


Resp: (b) D = 41,77 — 1,0987 + 0,0878617. (o) 170 pés e 516 pés. 


“40. A tabela seguinte apresente a taxa de natalidade, por 1 000 pessoas, nos 


„Estados Unidos, durante os anos de 1915 a 1955, com intervalos de 5 anos, (a) 


Representar graficamente os dados. (b) Encontrar uma parábola de minimo 
quadrado que se ajuste aos dados. (c) Calcular os valores de tendência e com- 
pará-los com os resis. (d) Explicar por que a equação obtida no item (b) não é 
conveniente para as finalidades de extrapolação. 


Anos 1915 1920 1925 1930 1935 1940 1945 1950 1955 


Taxa de 
nascimento por | 250 237 21,3 189 169 179 19,5 286 246 
1 000 pessoas 


Fonte: Department of Health, Education and Welfare 


Resp: Y = 18,16 — 9,1083X + 0,4853Xº, em que Y é a taxa de natalidade 
por 1000 pessoas, e a unidade de X é igual a 5 anos, com a origem em 1.º de julho 
de 1935. 
` í 


400 Ee viii ESTATÍSTICA 


4 O número Y de bactéries, por unidade de volume e tente em uma cul. 
tura depois de X horas, é apresentado no, tabela seguinte. (a) Representar grà- 
ficamente os dados, em um papel semilogarítmico, cuja escala logarítmica é em- 


pregada para-Y'e à aritmético pare X. (b) Ajüstär umà curva “de "minimo que- 
drado;, da forma Y = abYaos dedos, e explicar por que essa equáção particular 
produziris, bons resultados. (6) Comparar os valores de Y. obtidos por ygeio 
dessa equação, com os resis. (d) Avaliar o valor de Y para X = 7. 


Násmero de horas (X) oO 1 2 304 5 6 


Número de bactérias por volum: y 
unitário (P) TOS] 32 47 65'923 132 190 275 


Resp.: (b) Y =32,14 (1,427) ou Y = 32,14 (10)%54X ou Y = 32,14 a 
sendo e = 2,718.... a base dos logaritmos neperianos. (d) 387. 


42, No problema anterior, mostrar como um gráfico, desenhado em papel 
de gráfico semilogarítmico, pode ser usado para a obtenção da equação desejada. 
som o emprêgo do método de mínimo quadrado. i 
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TEORIA DA CORRELAÇÃO 


Correlação e regressão 


No último capítulo, considerou-se o problema da regressão ou 
estimação de uma variável (a dependente) a partir de uma ou mais 
variáveis correlatas (as independentes). Neste capítulo, considerar- 
se-á o problema intimamente ligado àquelas, o da correlação, ou do 
grau de relação entre as variáveis, que procura determinar quão bém 
uma equação linear, ou de outra espécie, descreve ou explica a xela- 


ção entre a; 


Se todos os valores das variáveis satisfazem exatamente uma, 
equação; diz-se que elas estão perfeitamente correlacionadas ou que há 
correlação perfeito entre elas. Assim, as circunferências C e os raios 
r de todos os círculos estão perfeitamente correlacionados, porque 
C=2rr. Se 2 dados são lançados simultâneamente 100 vêzes, não 
há relação entre os pontos correspondentes a cada um dêles (a não 
ser que os dados sejam viciados), .isto é, êles são incorrelacionados. 
As variáveis altura e pêso de indivíduos revelariam alguma correlação. 

Quando estão em jôgo sômente duas variáveis, fala-se em corre- 
lação e regressão simples. Quando se trata de mais de duas variáveis, 
fala-se de correlação e regressão múltipla. Neste capítulo, conside- 
ra-se apenas a correlação simples. A correlação e a regressão múl- 
tiplas serão tratadas no Capítulo 15. 


Correlação linear 


Se X e Y representam as duas variáveis consideradas, um dia- 


grama de dispersão mostra a localização dos pontos (X, Y) em um 
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, cem cair nas proximidades de uma reta, como nås partes 
(a) e 0) “Fig. 14-1, a correlação é denominada, linear. Nesses 
casos, como se viu no Capítulo 13, uma equação linear é apropriada 
aos fins de regressão ou estimação. 


Se Y tende a aumentar quando X cresce, como na parte (a), a 
correlação é denominada positiva ou direta. Se Y tende a diminuir 
quando .X aumenta; como na parte (b), a correlação é denominada, 
negativa ou inversa. ` 


Se todos os pontos parecem estar próximos de alguma curva, & 
correlação é denominada não-linear e uma equação não-linear é apro- 
priada parà a regressão ou a estimação, como vimos no Capítulo 13. 
É claro que a correlação não-linear pode ser algumas vêzes posi- 
tiva e outras negativa. 


. Se não há relação indicada entre as variáveis, como na Fig. 14-10) 
diz-se que não há correlação entre elas, isto é, elas são incorrelationadas. 


x — x - x 
1h) Correlação Linvar Nogativa to) Nonhuma Corralação 


10) Corrolagão Linear Positivo 


Fig. 14-1 


Medidas de correlação 


Pode-se determinar, de modo qualitativo, quão bem uma certa 
reta ou curva representa a relação entre as variáveis, mediante a 
observação direta do próprio diagrama de dispersão. Por exemplo, 
vê-se que uma linha reta é muito mais conveniente para representar 
a relação entre X e Y, para os dados da Fig. 14-1(a); do qué para os 
da Fig. 
da reta 


Fig. 14-10). a : 


Ao tratar de modo quantitativo do problema da dispersão dos 
dados amostrais, em relação a retas ou a curvas, ‘será necessário 
. estabelecer. medidas de correlação. 


(b); graças ao fato de haver menor dispersão em tôrno * 


necrose 
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Linha de regressão de mínimo quadrado 


Considerar-se-á primeiramente o problema de verificar quão 
beni uma linha reta representa a relação entre duas variáveis. Para 


“isso, serão necessárias as equações da reta de regressão de mínimo 


quadrado, obtidas no Capítulo 13. Como se viu, a reta de regres- 


“são de mínimo quadrado de Y para X é: 


Y = a tag, a) 


em que 0, € @ são deduzidas das equações normais 


f EY =a N taAX o 
EXY = EX + 3X, 
que produzem 
— Enx- (2X) (ZXY) 
( w= NAX: — (5X) g 


l NEXY — (2X) (Y) 

u= -NZX -— (2X) 

De modo semelhante, a reta de regressão de X para Y é dada por: 
X = byt br... Ae (4) 


em que bo é bı são deduzidas das equações normais 


f EX = bN + bEY (5) 
IXY = bEX + EP, É 
que produzem 
— ENE) = (EN (ZXY) 
f a NZr — (SYP © 


E - NEXY - ENEM 
0: = — NEY EF 


às Eqs. (1) e (4) podem ser escritas, respectivamente, sob 
as formas >- 


Zay y (Bay m 
y= (3 ) ve r= (52) y (7) 


emque s=X ~-e y=Y-Y 
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Ás equações de regressão são idênticas apenas quando todos os 
pontos do diagrama de dispersão caírem sôbre uma reta. Nesse 
caso, há uma, correlação linear perfeita entre X e Y. 


Êrro padrão da estimativa 


Se Yes representar os valores de Y correspondentes a valores: 


de X, avaliados por méio da Eq. (1), uma medida da dispersão em 
relação à reta de regressão de Y para X será dada pela fórmula: 


Ely — Vea)? 
ROS ME? 


Srx=% (8) 


que é denominado érro padrão da estimativa de Y para X. 


Se fôr empregada a reta de regressão (4), um êrro padrão análogo 
da estimativa de X para Y, será definido por: 


xr o EE Ha, (9) 


Em geral, sp.x * 8x.y. 


A Eq. (8) pode ser escrita sob a forma: 


Y? — -aX 
s, 2Y a mEXY ai 


que pode ser mais conveniente para o cálculo (veja o Probl. 3). 
Uma expressão semelhante existe para a Eq. (9). 


O êrro padrão da estimativa tem propriedades análogas às do 
desvio padrão. Por exemplo, se se construírem retas paralelas ò de 
regressão de Y para X, com as respectivas distâncias verticais Sr.x, 
Zsy.x è 3sy.x entre elas, verificar-se-á, se N fôr suficientemente 
grande, que estarão incluídos, entre essas retas, cêrca de: 68, 95 e 
99,7 % dos pontos amostrais. 


Da mesma forma que se verificou o desvio padrão corrigido, dado 
N 


A` è 
pors = E j s, é conveniente para as pequenas amostras, tam- 


1 


bém o é o êrro padrão corrigido, dado por Byx= 


Por essa razão, alguns estatísticos preferem definir as expressões (8) 
ou (2), com o denominador modificado de N para N—2. 


“ap, dá TEORIA. DAECORRELAÇÃO A 


405 


Variação explicada e mão-explicadea 
A A variação total de Y é definida como E (Y — F)? isto é, a soma 
dos quadrados dos desvios dos valores de Y em relação à média F. 
Como se mostra nó Probl. 7, essa expressão pode ser escrita sob a 
forma: ù 
IY = F) = EY PY) + EY en ~ F). (11) 

O primeiro têrmo da direita da expressão (11) € denominado 
variação não-explicada, enquanto que o segundo é a variação explicada, 
assim denominadas porque os desvios Yes ~- Y têm um padrão de- 
finido, enquanto que os Y — Ye comportam-se de maneira, casual 
ou imprevisível. Resultados semelhantes prevalecem para a va~ 
riável X. 


Coeficiente de correlação 


O quociente da variação explicada para a total é denominado 
coeficiente de determinação. Se a variação explicada fôr nula, isto é, 
se a variação total fôr tôda não-explicada, êsse quociente será, igual 
a zero. Se a variação não-explicada fôr nula, isto é, se a variação 
total fôr tôda explicada, o quociente será iguala 1. Nos outros casos, 
o quociente terá valor compreendido entre zero e um. Como are- 


lação é sempre positiva, ela será representada por 7%, A quantidade r, 


denominada coeficiente-de correlação; é dada por: =. 
i [variação explicada i VEM ~F; 12 
pes 4 variação total MY — Y? (2) 


e varia entre —1 e +1. Os sinais + são usados para a correlação 
linear positiva e para a negativa, respectivamente. Note-se que r 


é uma quantidade sem dimensões, isto é, independe das unidades. 


adotadas. 
Mediante o emprêgo das expressões (8) e (11) e pelo fato do des- 
` vio padrão de Y ser 


H 
e 
a] 
i 
Ss 


13) 


verifica-se que a Eq. (12) pode ser escrita, desprezado o sinal, sob s 
forma: 


ou syy =sy yi- - (14) 


r= gi 


Há equações semelhantes, quando X e Y são permutados. 
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Para o caso da correlação linear, a quantidade r conserva-se a 
r se considere X ou Y como a variável independente. Por 
a medida muito boa da correlação linear entre duas 


Observações sôbre o coeficiente de correlação 
As definições (12) ou (14), para o coeficiente de correlação, são 
absolutamente gerais e podem ser empregadas tanto para as relações 
não-lineares como para as lineares, com a única diferença do Fes 
ser calculado por meio de uma equação de regressão não-linear em 
lugar de uma linear e dos sinais + serem omitidos. Nesse caso, a 
Eq. (8), que define o êrro padrão da estimativa, é perfeitamente geral. 
A Eq. (10), entretanto, que sômente aplica a regressão linear, deve 
ser modificada. Se, por exemplo, a equação da estimativa, fôr: 


Y = a tH aX + aX? t o. + a XI, (15) 
a Eq. (10) será substituída por: 
by = Eyre a XY + a Zar =... — Qua DX Y (16) 


Nesse caso, o êrro padrão corrigido da estimativa (veja a discussão 


na pág. 404) é Spy = 4 z Sr:x, em que a quantidade N — n 


é denominada número de graus de liberdade. . 


Deve-se acentuar que o valor de r, calculado em qualquer caso, 
mede 0 grau de relação correspondente ao tipo de equação que é real- 
mente ádmitida. Portanto, se fôr adotada uma equação linear, e 
se as exprossões (12) ou (14) conduzirem a um valor de r próximo de 
zero, isso significa que quase não há correlação linear entre as variá- 
veis. Entretanto, não significa que não há nenhuma correlação, 
porque pode realmente existir uma forte correlação não-linear entre 
as variáveis. Em outras palavras, o coeficiente de correlação mede 
a excelência do ajustamento aos dados da equação realmente consi- 
derada. A menos que haja especificação em contrário, o têrmo cõe- 
ficiente de. correlação será usado para indicar o de correlação linear. 

“ Poder-se-ia também assinalar que um coeficiente de correlação 


elevado (isto é, próximo de 1 ou — 1) não. indicará necessâriamente ` 


uma dependência direta entre as variáveis. Dessa, forma, pode haver 
uma correlação -sensívol entre o número de livros publicados anual- 


“en 
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mente e o de jogos de beisebol disputados nesse período. Êsses 
exemplos são, algumas vêzes, designados como correlações disparatadas 


| ou espúrias. 


Fórmula da co-variância para ọ coeficiente de correlação 
linear : 


Se fôr admitida uma relação linear entre duas variáveis, a Eq. (12) 
tornar-se-á: 
Bay 
T= === a7) 
V Cut) (By) | 
em que t =X -— X e y= Y —Ọ (veja o Probl. 10). Esta fór- 
mula, que, automaticamente, proporciona o sinal adequado de 7, é 
denominada de co-variância e indica claramente a simetria entre 
XoY, 


Se se escrever 


Zu aê o 
sxy = E, sx = q5, sy = e, (18) 


então sx e sy serão reconhecidos como os desvios padrões das variá- 
veis Xe Y, respectivamente, enquanto que sx? e sy? são suas variân- 
cias. A nova quantidade sxy é denominada co-variância de X e Y. 
Adotados os símbolos (18), pode-se escrever (17) sob a forma: 


Sil 


r= EL. (9) 


Note-se quer não independe apenas da escolha das unidades 
de Xe Y, mas também da origem. 
Fórmulas abreviadas para o cálculo 


A fórmula (17) pode ser escrita sob a forma equivalente: 


a NEXY — (EX) (EF) 
VIN EX? — CONS? - O] 


(20) 


que é. freqüentemente usada para o cálculo de 7 (veja os Probls. 
15 e 16). 

Para os dados agrupados em uma tábela ou distribuição de fre- 
giência bidimensional (veja o Probl. 17), é conveniente usar o 


+ m~ a 


método abreviado apresentado em capitulos anteriores. 
a expressão (20) pode ser escrita sob a forma: 


NES — (Ef) (Eru) E 
INES — (jeux) NEirer — Ch] 


> 
Nesse caso. 


2 


Veja o Probl. 18. Por conveniência, nos cálculos.em que se em- 
prega essa fórmula, usa-se uma tabela de correlação (veja o Probl. 19). 


Para os dados agrupados, as fórmulas (18) podem ser escritas: 


) (Z )] 22) 
N 


(23) 


(24) 


em. que cy e cy são as amplitudes dos intervalos de classe (admitidas 
como constantes) correspondentes às variáveis X e Y, respectivamente. 
Note-se que as expressões (23) e (24) são equivalentes à fór- 
mula (11) do Capítulo 4, pág. 113. 

Vê-se que a fórmula (19) será equivalente à (21), se forem utili- 
“zados os resultados das expressões (22) e (24). x 


Retas de regressão e o coeficiente de correlação linear 


A equação da reta de mínimo quadrado, Y = a + mA, ou 
reta de regressão de Y para X, pode ser escrita sob a forma: 


(25) 


De modo semelhante, a reta de regressão de X para Y, X = 
= bo + bY, pode ser escrita: 


x-F=SE(y 7 
sy É 


As declividades das retas (25) e (26) sòmente serão iguais 
quando r = + 1. Nesse caso, as. duas retas são idênticas e há 
correlação linear perfeita entre as variáveis X e Y. Quando 


«o CAP. H4 cume: 


CORRÉLAÇ: 


r = 0, as retas estão em ângulo reto e não há correlação linear entre 
XeY. Dessa forma, o coeficiente de correlação linear mede o afas 
É 

tamento angular entre as duas retas de regressão. 


Note-se que, se as Eqs. (25) e (26) forem escrit 
as formas Y +aX e X =b + hY, respectivamente, então 


abi = r? (veja o Probl. 223. 


-Correlação ordinal 


s das variáveis, ou quando ess: 
ser dispostos em ordem de ta- 


Em vez de utilizar valores pr 
precisão fôr inútil, os dados pode 
manho, importância, ete., mediante o emprêgo dos números 1,2,..., 
N. Se duas variáveis X e Y estão orlenadas dessa maneira, o cofi- 
ciente de correlação ordinal é dado por: 


“620? E 
Tordina = | — VW D' 27) 


em que D = diferenças entre as ordens dos valores correspondentes 
de X e Y; N = número de pares de valores (X, Y) dos dados. 


A fórmula (27) é denominada de Spearman para a correlação 
ordinal. ` 


Correlação de séries temporais 


Se cada uma'das variáveis, X œ Y, depende do tempo, é possível 
que exista uma relação entre X e Y, mesmo que essa relação não seja, 
necessâriamente, de dependência direta e que possa conduzir s nma 
“correlação disparatada”. Obtêm-se o coeficiente de correlação pela 
simples consideração das pares de valores (X, Y) correspondentes a 
»ndo-se, como de costume, mediante o emprégo 
na (veja o Probl. 28). 


várias épocas 
das fórmulas a. 


É possível tentar correlacionar os valores de uma variável X, 
em certas épocas, com os correspondentes de F, em ocasiões anteriores. 
do qutocorrelação. 


Isso é fregúentemente deno: 


ributos 


itos neste capítulo não nos capacita a conside- 
ze, não são numéricas, 


Os métodos de: 
rar a correlação de variáveis que, por sua notur 
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como os atributos individuais (exemplo: côr dos cabelos, dos olhos 


ete.) Para; urg estudo da correlação de atr ibutos, veja o Capítulo 12. 


| Teoria artóstral da correlação 


Pode-se. imaginar que os N pares de valores (X, Y) de duas variá- 

A yeis constituer uma amostra, proveniente da população de todos os 

“pares possíveis. Como há duas variáveis implicadas, essa população 

é denomináda bidimensional e admite-se que ela apresente uma dis- 
tribuição norpial bidimensional. 

Pode-se “pensar no coeficiente de correlação de uma população 
teórica, represéntado por p, que é avaliado a partir do coeficiente de 
correlação amostral r. Testes de significância, ou hipóteses concer- 
nentes a vários valores de p, exigem o conhecimento da distribuição 


amostral de r, Para p = 0, essa distribuição é simétrica e pode-se” 


utilizar uma estatística que envolve uma distribuição de Student. 
Para p = 0, a distribuição é assimétrica. Neste caso, uma transfor- 
mação devida a Fisher produz uma estatística que tem distribuição 
aproximadamente normal. Os testes seguintes resumein os proces- 
sos atinentes. 
1.º Teste da hipótese p=0. 
Aplica-se, nesse caso, o fato da estatística: 
je ERES es) 
vi-—r 
ter uma distribuição de Student, com y = N — 2 graus de liberdade 
(veja os Probls. 33 e 34). 
2. Teste da hipótese p = po xá 0. 


Parte-se do fato da estatística: 


i 1 tpt 1 
=> = 2 
Z 3 Ae z z) 1,1513 logo ( 


E) œ 


2,711828 ..., ter distribuição aproximadamente normal, 
+ O desvio padrão dados por: 


= 1,1513 log (5 F e), 


em que e 
| com a médi 


p= 
Po (30) 


PATET EI 


Esses fatos também podem servir para determinar os limites de 


-. confiança dos coeficientes de correlação (veja os Probls. 35 e 36). 


A expressão 129) é denominada. transformação Z de Fisher. 


3. Significado de uma diferença entre cosficientes de 
correlação. 


Para dotewniner se dois coeficientes de correlação, 7) e rs, tirados 
de amostras de tamanhos N, e Na respectivamente, diferem signifi- 
cativamente entre êles, calculam-se Z, e Za, correspondentes & r, € to 
mediante o emprêgo da expressão (29). Serve-se, então, do fato da 
estatistica: 


ARES RR 
aa RA aaa (31) 
OZy-Za 


em que 


` TEE HE 1 
Uzz = Mz — dm € Ozz = Voz? +oz = va + PIR’ 


ter distribuição normal (veja o Probl. 37). 


Teoria amostral da regressão 


A equução de regressão Y = ao + aX é obtida com base em 
dados aimostrais. Interessa, frequentemente, conhecer a equação de 
regressão correspondente à população da qual a amostra foi extraida. 
Os dois testes seguintes referem-se a essa população. 


1. Teste da hipótese ar= 41, 


Para testar a hipótese do coeficiente de regressão a, ser igual a 
algum valor específico 41, baseia-se no fato da estatística: 


(32) 


apresentar a distribuição de Student, com N — 2 graus de liberdade. 
Pode-se, também, utilizar êsse fato para deduzir, dos valores amos- 
trais, intervalos de confiança dos coeficientes de regressão popula- 
cionais (veja:os Probls. 38 e 39). É 
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KSPAPI 


2. o de hipótese para valores previstos. 


Seja Yọ o valor previsto de Y, correspond nte a x= Xo ava- 
liado por meio da equação de regressão amostr i, isto é, Yo = @ + 
-aXe Seja Y, o valor de Y previsto para a população, correspon- 
dente a X = X, Então, a estatistica: 


{i = — 


sx VN FLEX RS 


Y, om Yy 
= es aee 33 
Fr VI + UN F (Xo — PKN sx’) o3 


apresenta uma distribuição de Student, com N — 2 graus de liberdade. 
Daí podem ser deduzidos os limites de confiaùça para a população 
provista (veja o Probl. 40). 


3. Teste da hipótese para valores médios previstos. 


Seja Ya o valor previsto de Y, correspondente a X = Xu, gedu- 
zido da equação de regressão sinostrai, isto é, ao +H al Seja 
f, o valor médio previsto de Y, para u população correspondente a 
X = Xo Então a estaiiatica: 


ta — 


(34) 


apresenta uma distribuição de Student, com N — 2 graus de liber- 
dade. Daí podem ser «leduzidos os limites de confiança para a popu- 
lação prevista (veja o Prohl. 41). 


Problemas Resolvidos 


Diagramas de dispersão e retas de regressão 


1. A Tabela 14.1 apresenta os pesos respectivos, X e Y, de 
uma amostra de 12 pais e de seus filhos mais velhos. 

(a). Construir um diagrama de dispersão. 

(b) Determinar » linha de regressão de mínimo iisdraio de Y 


para X. 


gar. dá o ~ EORI A 


(c) Determinar a linha de regressão de mínimo quadrado de X 
para Y. 


Tabela 14.1 


Pêso X dos pais (kg) 65.63 67 64 68 62 70 66 68 67 69 71 


Pêso Y dos filhos (kg) | 68 66 68 65 69 66 68 65 TI 67 68 70 


Solução: 


(a) O diagrama de dispersão é obtido mediante a locação dos pontos (X, Y) 
em um sistema de coordenadas retangulares, como está indicado na Fig. 14-2. 


ké EE EEA EERE ONA 


ps 
i 


Pose do Filho (kg) 


gem quere 
a sa w es ” v 
Pôso do Pai (kg) 


Fig. 14-2 


(b) .A reta de reg > de Y para X é dada por Y = ao + mX, em que q è 
a são obtidos mediante a resolução das equações normais: 


EA =N +alX 
EXY =a 2X +a DX? 


. As normas estão indicadas na Tabela 142 e, então, as equações normais 
tornam-se: 
Í 120, + 8004 81] 
800a + 53,418a1 = 54,107 


e, por meio delas, encontram-se ao = 35,82 e a, = 0,478, de modo que Y = 35,82 + 
+ 0,476X. O gráfico dessa equação está representado na Fig. 14-2. 


ae Wo ESTA E STEEN, CT LE “o 
Tabela 14.2 à 
xo Y x? PRE é: ý: 
6 ` 68 4225 4420 4624 
63 66 : 3969 4158 4356 
87 68 4489 4556 4624 
g4 65 4096 4160 4225 
65 89 4624 4692 4761 
6 66 l 3844 | 4092 4356 
70 63 4900 4760 4624 
66 65 4356 4290 4225 
68 n 4624 4828 5041 
67 67 4489 4489 4489 
69 68 4761 4692 4624 
71 70 5041 4970 4900 
amn Ecs 
EX = 800 RY =811 | BX?= 53418| XY = 54107] ZY? = 54849 


Outro método: 


_ ZYNSXY ~ EXN EXP) 
NEX? = (ÈX 


= 35,82, 


NÈXY ~ (2X) Y) 


SO NERO E 


= 0,476. 


e A reta de regressão de X para Y é dada por X = bo + aY, em que bo e 
bı são obtidos mediante á resolução das equações normais: 


FE =X aY 
EXP = WEY 4b 2Y? 


Usando as somas da Tabela 14.2, essas expressões tornam-se: 


| 12% + 811by = 800 
Bilbo + 54849b, = 54 107, 
e delas se deduzem do = — 3,38 e bı = 1,036, de modo que X = — 3,38 + 1 0367. 


O gráfico dessa equação está representado na «Fig. 14-2, 


Outro método: 


OZY?) - ENE o 
NE G 388, 


-NEXY -CNN 


pay Sy T 1086. 
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2. Resolver ós Probls. 1(b) e 1(c), mediante o emprêgo das 


retas de regressão: 


Èr 
Y 


emquer=X-X y= 


Solução: 


Primeiro método: O trabalho pode ser disposto como na Tabela 14.3. 


Tabela 14.3 
T Tr 
x Y z=X-X | y=Y-Y z? xy ye 
05 68 -17 0,4 2,89 — 0,68 0,16 
63 86 -3,7 I6 13,69 5,92 2,56 
67 8 0,3 o 0,09 0,12 0,16 
öt 65 -2,7 -26 7,20 7,02 6,76 
68 69 1,3 1,4 1,69 1,82 1,96 
62 66 —S,7 = 1,6 22,09 7,52 2,56 
7 68 3,3 10,89 1,3 0,16 
66 65 -0,7 —2,6 0,49 1,82 6,76 
68 A 1,3 1,69 4,42 11,56 
67 67 0,3 es 0,09 —0,18 0,36 
69 68 2,3 5,29 0,92 0,16 
a 70 4,3 18,49 10,32 5,76 
A um - 
EX =800 | EF =811 Er = Zxy= By = 
X =800/12 | Y =813/12 = 84,063 = 40,34 = 38,92 
=667 | =67,6 


A rete de regressão de E para X é: 


E (ada = UG ou F= 67,6 = 0,476(X = 66,7). 
16 


y = 1,086 ou X = 66,7 = 1,036(Y — 67,6). 


Esses resultados concordam com os do Probl. 1. 


Segundo método: 


Subtrai-se uma constante apropriada, por exemplo 60, de cada um dos valores 
de X e Y e procede-se como no segundo método do Probl, 17, Capítulo 13. 


Tabela 14.4 


ArT 


apr jg O 
Mas, IY — a aX) = EY ~ a N = aZX=0 
= SEXY — a ~ uX) = EXP - w ÈX ~ uÈ? = 0 


io e Yi ye yy ya 
E 2 E | Ee Á 
; 8 25 so 64 
7 t 9 18 36 
$ 8 49 56 Er 
3 b4 16 t 20 25 + 
2 é t 72 81 
í A 12 
10 8 100 30 a 
$ 5 36 30 25 
7 Ah 64 88 121 
9 E 49 49 49 
u E a 72 Gt 
k i 121 no 100 
mem EN į 
f se = 
EXt= 80 | Sreg (3 EXP = 647 | BYE = 729 
ET ai =7 
i =, 
Então: 
EA (ES 
apa SENE ATTE 
Visto = 1,036. 


Como X = 60 + 8012 = B67e F = 00. 

Ai O de mm 6 12 = 06,70 F = 60 + 9112 = 67,6, as equ 
gressão desejadas são iguais às anteriores. i de poi 
aen que, se ag e bo forem calculados por êste método, não seriam obtidos 
ea PAD Aa 208 anteriores, porque êles dependem da escolha daorigem. Por 
sso, Êste método é usado apenas para a obtençã ind 

a enção: de e de - 
dentes da escolha da origem. ú EDA a dedica 


Erro padrão da estimativa 
3. Sea reta de regressão de Y para X é dada por Y = a + oX 
provar que o êrro padrão da estimativa sy. x é dado por: . 
6 por: 


s? = EP — Go ÈY — a EXY, 


Yox NT 


Solução: 

Os valores de F, calcul io“ a 
sde F, culados por meio'da reta de regressão, sã = 
E gr , São dados por Fest= 


E 2E = Fe)? MY -o — aX? 


N 


porque, tendo em vista as equações normais: 


| BY =aN+ mix 
BXY = fX + aX’. 
Então: 
2 _ EYY- aX) Eca Br-nEXY 
‘Yx E N p N 


Éste resultado pode ser estendido às equações de regressão 'não-linenres. 


4 Set=X-Xey=Y- Y, mostrar que o resultado do 
Probl. 3 pode ser escrito sob a forma: 
2 Dp- u Lay 
srx E N 
Solução: 
No Probl. 3, para X = x + XeY=y+Y tems: 

Ns? y = EI? =a EY-a BXY = Ziy +Y -u Dut -a Dark P)= 
= IG + yF + F) — uo (2y + NT) — atly + Ry + ay + XP) 
= Ey FFR EN GX Dy qi Dr NEE ss. 
= EPA NF? — NT — adry = a NÈF = B? — ley + 
+A ~ o ~ aX) = 
= p — aÈry, 


LUNY = Eri 


em que foram utilizados os resultados Er = 0, Zy = 0e F = a + aX (que re 


sulta da divisão de ambos os membros da equação normal EY =aoN + 2X por N). 


5. Calcular o êrro padrão da estimativa sy.x para os dados do 
Probl. 1, mediante o emprégo: (a) da definição; (b) do resultado 
do Probi. 4. 


Solução: 

(a) No Probi. 0), a reta de regressão de Y pars X 6Y = 25,82 + 0,476X. 
Na Tabela 14.5 estão relacionados os valores reais de Y (da tabela do Probl. 1) 
por Vest, deduzidos da reta de regres- 
a X = 65, tem-se Yet = 35,82 + 


e os valores estimados de Y, represe: 
são. Por exemplo, em correspondêne: 
+ 0,470(05) = 68,76. 

Também estão relacionados os valores de Y — Yest, que são necessários para 


«áleulo de spy- 


“ESTATÍS E 


Tabela 14.5 


.6 | 68 67 s9 nm 


65 qi 


1,28] 0,81 | 0,67 | -1,14 


~2,24| 2,81 | -0,71 | -0,86] 0,38 


BY — Fes) 0,24} + (019º + 


= + (0,382 
7 m = 1,642 
e syy = VIOL = 1,28 kg. 
(b) Nos Probls. 1,2e 4: 
ENa Zy? — im Ery _ 38,92 -~ 0,476 (40,34) 
É T = z = 1,643 


k e syy = VOS 1,28 kg. 


- 6. (a) Construir duas retas paralelas à de regressão do Probl. 1 
que estejam a uma distância vertical sy.x dela. (b) Detérminar 
a percentagem dos pontos dos dados que caem entre essas duas retas. 

“e oJução : 


(a) A reta de regressão Y = 35,82 + 0,476X, obtida no Probl. 1, está 
representada em linha cheia na Fig. 14-3. As duas-retas paralelas, cada uma a uma 


zA) F T ii 7 T 
; PR E AR N S 
Fig. 14.3 


distância Mertical sy. x = 128(veja o Probl. 5) dela, estão representadas èm 
traços in tostompidos, na mesma figura, 


epi 
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(b) Vê-se, na figura, que dos 12 pontos representativos dos dados, 7 caem 
entre as retas, enquanto 3 parecem ostar localizados sóbre clas. Um exame pos- 


F terior, utilizando a última linha da Tabela 14.5 do Probl. 5, por exemplo, revela 


que 2 dêsses pontos estão entre as retas. Então, a percentagem desejada = 
= 9/12 = 75%. 


Outro método: 


De acôrdo com a última linha da Tabela 14.5 do Probl. 5, Y — Yest está com- 
preendido entre — 1,28 è 1,28 (isto é, = Sp y) para 9 dos pontos (X, Y). Então, 
a percentagem desejada é 9/12 = 75%. 


Se os pontos estão normalmente distribuídos em relação à reta de regr 
& teoria prevê que cêrea de 68% dêles caem entre as retas. fisse seria mais preci 
simente o caso, quando o tamanho da amostra fôsse maior. 

Nota: Uma melhor estimativa do êrro padrão de estimativa da população, 
da qual os pesos amostrais foram tirados, é dada por: 


Spy = VNIN = D) sy. = BJÃO (1,28) = 1,40 kg. 


Variação explicada e não-explicada 


7. Provar que Z(Y — P} = B (Y ~- Yo)? Vea — P). 


Solução: 
Elevando-se so quadrado ambos os membros de Y — P=(Y-—Yos) + 
+ (Vest — F) e somando-os depois, tem-se: i 


LY — F) = EOY — Yost)? + Eest — FP + ZE — Fest) (Yost — Ÿ). 


O resultado desejado será obtido imediatamente, se se conseguir mostrar 
que a última soma é nula. No caso da regressão linear isso se verifica porque: 


EY — Yet)XY en — F) = Z(Y — ao — aX) (ao + aX — Pm 
= XY — ao — mX) — a ZX(Y — a — aX) — YE — 
— œ ~ aX) = 0 


por causa das equações normais XY — ao ~a X) = 0 e EXY — a — mA) = O 
Pode-se demonstrar, de maneira análoga, que o resultado é válido para as 
regressões não-lineares, mediante o emprêgo de uma curva de mínimo quadrado, 


` dada por: - E 


Vest = do + aX + xt + o + aX". 


8. Calcular: (a) a variação total; (b) a variação não-explica- 
da; (c) a variação explicada, para os dados do Probl. 1. 


420 


Solução: 
(a) Variação total = XY — FP = Ey’ = 38, oo do Probl. 2. 
(b): Variação  não-explicada = S(P— Pest)? = N2 y 
(e) Variação explicada = X( Fo Fy = 38,92 — 19,70 = 19,22, utilizando 
o Probl. 7, 


Outro método: 


Como É = 811/12 = 67,58, pode-se constrmir a tabela seguinte, empre gandos 
se os valores de Yes obtidos ne Tabe lo Probt. 


Yest ~F ou 


-0,82 1,77 0,13 =1,30 0,61 —2,25 1,56 —0,3 2 
Fest = 07,58 3 5 5 1,56 —0,34 0,61 0,13 1,08 2,04 


Então, M Fest — F)? = (0,827 + (=1,77)? +... + (2,04)? = 19,21. 


Os resultados dos itens (a) e (b) podem também ser obtidos diretamente, 
Coeficiente de correlação 


9. Determinar: (a) o coeficiente de determinação; (b) o de 
correlação, para os dados do Probl. 1. Usar os resultados do Probl. 8.. 


. Solução: 

fici : variação ex 19,22 

ofi or] o sro M Jicada 19,2 
(a) Coeficiente de determinação = r veia total Er 


= 0,4938. 


(b) Coeficiente de correlação =r = + w/0,1938 = + 0,7027. 


Como a variável Vest aumenta quando X cresce, a correlação é positiva e, 
portanto, escreve-se r = 0,7027 ou 0,70, com dois algarismos significativos. 


19. Provar que, para a regressão linear, o coeficiente de correla- 
ção entre as variáveis, X e Y, pode ser escrito sob a forma: 


oo 2y oo 
EE 


em quer=X-Fey=Y-F 


= 19,70, "do Probl. EM 
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Solução: . 


A linha de regressão de minimo quadrado de Y pars X pode ser escrita. sob 


= 2 6 t= Yet — F 
a forma Yest = do + aX, OU Yent = mt, emi que a = “7 © Ves 


{veja o Probl; 15(a) do Capítulo 13). Então: 


E(Fest— PP Bye? 


a variação explicada . 


variação totai ZO- 9; Èy 


2 Et (Ery 


Dy” EE) 


Ezy 
e . re = VESTEM . 
tiva, quando Yest aumenta com o acréscimo de z (isto é, correlação linear positiva) 
e negativa quando: yest diminui com o acréscimo de a (isto é, correlação linear 
negativa), ela tem automâticamente o sinal adequado a ela associado. Então, 
define-se o cosficiente de correlação linear como sendo: 


ra Bay 
VET) 


Esta é denominada, irequentemente, fórmula do produto momento (ou de co~ 
-varifncia); para -o coeficiente de correlação linear. ses meia gaia Aa aizgo 


o e w y, R 
Fórmula da co-variância para o coeficiente de correlação linear 


mn. “Determinar o coeficiente de correlação linear entre as variá- 
veis, X e Y, apresentadas na Tabela 14.6 


Tabela 14,6 


Solução: 


lo pođem ser dispostas como nè Tabela 147. 


Às operações usctssárias ao 


o ESTATÍSTICA. ` 


Tabela 14.7 


2º zy y2 
36 24 16 
16 12 9 
9 3 1 
1 1 1 
1 0 0 
4 4 4 
18 12 9 
49 28 16 
Ex2=132 Ery=84 Ey=56 


E ETE NA 
VER VDE 


Esse valor mostra que há uma correlação lineer muito forte entre as variáveis, 
como anteriormente foi observado nos Probls. 8e 12 do Capítulo 13: 


12. Determinar: (a) o desvio padrão de X; (b) o desvio padrão 
de Y; (c) a variância de X; (d) a variância de Y; (e) a co-variân- 
cia de X e Y, para os dados do Probl. 11. a 


Solução: 


(a) Desvio padrão de X = sy = 2 = qe a ve dá 4,06 
(b) Desvio. padrão de Y = syp = 2 Fy -f - q2 = 2,65 


(o) Variácia de X = sy? = 16,50 (d) Variância de Y = sp? = 7,00 


(e) Co-variância de X e Y =syy= Zer = E = 10,50 


13, Verificar a fórmula 7 = PR para os dados do Probl. 11. 
Ea Y 


xy _ 1050 


= ES = oC) T 06) (2,65) 0,976, concor- 


lá, Mediante o emprêgo da fórmula da co-variância, obter o 
coeficiente de correlação linear para os dados do Probl. 1. 
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Solução: s 
As operações necessárias ao cáleulo podem ser dispostas como na Tabela 14.3 
“do Probl. 2. Então: 


Eey JA 40,34 
T VEAC VLS 88) 
que concorda com o do método mais longo do Probl. 9. 
15. Mostrar que q coeficiente de correlação linear é dado por: 
l NEXY — (EXEY) 
VINEX? — EXPTINEY? — ÈY) 


= 0,7027; 


r= 


Solução: A A 

Fazendo-se z = X -X,y=Y—Y no resultado do Probl. 10, tem-se: 
Day E) XX — XY — Y) 

VE) VEX -X 2-9) 


(1) 


Mas, 
IX - FWY — Î) = X(XY — XY - X9 + XF) = 2XY - 2Y — 


— FSX NRP = XXY - NET — NIX NRP = EXP ~ NEY = 
N EXEY' 
=3XY — aan 
porque X = (LXN e F = (EYN. 
De modo análogo, H(X ~. xy = EX 2XK +F) = EX? sEBxANTE = 
AY, EXP vp Ex? 
N N N 


-2% - 


DAY 
a. Então, a expressão (L) torna-se: 


e RY -Fp = 2Y- > 
ZXY — (EXEN 
VERONICA CN 
"NEXY - EXE) 
WEB OXJ INEP - OP 
16. Empregar a fórmula do Probl. 15 para obter o coeficiente 
de correlação linear para os dados do Probl. 1. 


- Solução: 
De acôrdo com a Tabeis 14.2 do Probl. 1, tem-se: 
j NEXY — (EXE) 
E ERA INS EPA 
(12) (54 107) — (800) (811) À 
(12) (53 418) — (800) (612) (51849) — ( 


como nos Probls. 9 e Jd. 


ESTATÍSTICA 


» D ir Š 


Outro método: 


O valor de r é independente da escolha de origem de X e de Y. Pode-se; 
portanto, usar os resultadòs do segundo método do Probl. 2 para obter: 


ns NEXY — EXE) a 
VINEXT — (EXP NAY- OY] 

2 12(647) — (80X(91) Sor 
(12) (618) ~ (807) (A2) (729) — (9 


Coeficiente de correlação para dados agrupados 


17. A Tabela 14.8 apresenta as distribuições de frequência dos 
graus finais de 100 estudantes, em matemática e em física, Com 
referência a essa tabela, determinar: 

` (a) o número de estudantes que receberam graus entre 70 e 79 
em matemática e entre 80 e 89 em física; 

(b) a percentagem de estudantes cujos graus de matemática 
estão abaixo de 70; 

(c) o número de estudantes que receberam grau 70, ou maior, 
om física, e menos do que 80, em matemática ; 


(d) a percentagem dos estudantes que passaram tanto em física 
“como em matemática, admitindo-se que 60 é o grau mínimo de pro- 
moção. x 
Tabela 14.8 


Graus em Matemática 


50 — 59 | 60.— 69 


Graus em Fisica 


Totais 


! 

+ 

| 
EE 

| 


TEORIA. DA CORRELAÇÃO 


Solução: 


a ta) Poxcorre-se para baixo a coluna encimada por 70-79 (graus em mate- 


mática), até à linha correspondente a, 80-89 (graus em física). O valor encontrado, 
.4, dá o número desejado de estudantes. A 

(b) Número total de estudantes cujos graus de matemática estão abaixo de 
70 = número daqueles cujos graus estão entre 40 e 49 + número daqueles cujos 
graus estão entre 50 e 59 + número daqueles cujos graus estão entre 60 e 69 = 
=7+15+25= 47. 

Percentagem dos estudantes cujos graus de matemática estão abaixo de 70 = 
= 47/100 = 47%. 

(c) O número desejado de estudantes e o total dos valores da Tabela 14.9, 
que reproduz uma parte da Tabela 14.8. 

Número desejado de estudantes = 14+ 5+2 +4-+10 = 22 


Tabela 14.10 


Graus em Matemática 


Tabela 14.9 


Graus em Matemática 


(d) Com referência à Tabela 14.10, que é tirada da 148, vê-se que o número 
de estudantes cujos graus estão abaixo de 60, tanto em matemática como em física, 
€3+3+6+4+5=17. 

Então, o número dos estudantes cujos graus são iguais a 60 ou maiores nas 
duas matérias = 100 — 17 = 83, e w percentagem desejada é 83/100.= 83%. 

A Tabela 14.8 é freqiientemente denominada de freqüéncia bidimensional ou 
distribuição de fregrência bidimensional, Cada espaço da tabela é denominado 
casa e corresponde a um par. de classes ou de intervalos de classe. O número 
indicado em. cada espaço é denominado fregência da casa. Por exemplo, no item 
(a), o número 4 éa fregúência da casa correspondente ao par de intervalos de 
classe de 70 a 79 em matemática e de 80 a 89 em física. 

Os totais indicados nas últimas linha e coluna são denominados totais margi- 
nais ou fregúências marginais. Eles correspondem, respectivamente, às frequên- 
cias do classe das distribuições de frequência separadas dos graus de matemática 
e. de física. 


18. Mostrar como deve ser modificada a fórmula do Probl. 15, 
para o caso de dados agrupados, como os da tabela de freqüéncia 


bidimensional (Tabela 14.8) do Probl. 17. 


eo 


ESTATÍSTICA 1: 


Solução: 


Paraos gados agrupados podem-se considerar os, . diversos valores das variá- 
veis, Xe: Y, como coincidentes com os pontos médios, eifquanto que fy e fy são as 
freqiiências classe de correspondentes, ou as frequências marginais indicadas nas 
últimas linha-e coluna da tabela de frequência bidimensional. Se f representar 
„as várias frequências das casas correspondentes aos pares de pontos médios (X, Yy 
pode-se, então, substituir a fórmula do Probl.. 15 por: 


NZJ XY — (EO) 
VINI X — Ex XY] (N2jy Y — (Èy YP) 


a) cre 


Fazendo X =A teyuyx e Y=B -cy uy, em que cy e cy são as amplitudes 
dos intervalos de classe (considerados constantés) e 4 e B pontos médios arbitrá- 
rios correspondentes às variáveis, a fórmula acima torna-se: 


= NĒjüy uy — (Dix ux)(Žjy uy) 
VINZIx ux- (Dix ux] [NE fy y- fy uy) 


(2) 


Tabela 14,11 


Graus om Matemática, X 


Graus em Fisica, X 


= 126 


“fais = 


28 


Soma dos núme-| 
ros dos cantis | 32 
em cada colona 


Bivar | 
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Esse é o método abreviado (desvio em intervalos) usado em capítulos anteriores, 
coro um processo prático para o cálculo de médias, desvios padrão e inomentos 
de ordem mais elevada. 


19. Determinar o coeficiente de correlação linear entre os graus 
de matemática e de física do Probl. 17. 


Solução: 

Emprega-se a RR (2) do Probl. 18. O trabalho pode ser disposto 
como na Tabela 14.11, que é denominada quadro de correlação. As somas Djy, 
Lx ux Dix Wx, Bjy, Bjy ur e Bfyu?y são obtidas mediante o emprêgo do 
método abreviado (desvio em intervalos), como nos capítulos anteriores. 


o árido: do canto de cada casa representa o produto fuy uy, em que f éa 
frequência dessä casa. A soma dêsses números, em cada linha, está indicada na 
última coluna da mesma. Sua soma, em cada coluna, está indicada na última 
linha da mesma, .Os totais finais, da última linha e da última coluna, são iguais 
e representam Bfux uy . g 

“De acôrdo, com a Tabela 14.11, tem-se: 


MX NEjuxuy —(Žfx ux) Etr uy) 
VINS Jx x — Gxu] NÈ fy dy — Uy uy) 
(100025) — (649-59 i 
T VRD (6AT 00) 253) — (~55)] 
16,020 x 


= — SEE = 037686. 
“(19 504) (22 275) 


pm 


20, Usar o quadro de correlação do Probl. 19, para caleular: 


(a) sx; (b) sy; (0) sexy, e verificar a fórmula r = sxy/(sxsy). 
Solução: 
Ba Bruxo (Ely my o BB E y P 
(a) sx = ex y N T N =10 Yio — Moo) = 
= 13,966 


Ef. ( Zigir Y =10 4/88 -GEY E 
É 100 100 


© sy 


t 
$ 
D 
z 


Li 
tua 
w 
lo 
1% 
x 


(e) sx? = exer | Elm tr (7a y (EH Zjyuy w) z 


125 {64 553 T aa 
= u0 a0) ES (5) (E 1 960,20 


ag” aiem SORREL AGAO 


: é ca sã Solução: ş 
Portanto, os desvios padrão dos graus de matemática e de física são 14,0 e 


14,9, respectivamente, enquanto que sua co-variância é 160,2. 
xr 160,96 ` 


rocficiente A rel sã + = — „160,26 r = Ni A ` 
O cocficiente de correlação: r Sey (12,066) (14,025) 0,7686, que 


» De acôrdo com os Probis. 1(b) e (c), respectivamênte, a; = 484/1 016 = 
=0,476 e bı = 484/467 = 1,036. - i 

Então, 7? = abı = (484/1 016X(484/467) e 7 = 0,7027, que concorda. com o 
dos Probls. 9, 14 e 16. d 


concorda com o Probl. 19. 


| e Po. 24. Escreveras equações das retas de regressão de: (a) Y para X; 


Retas de regressão e o coeficiente. de correlação ` 
(b) X para Y, para os dados do Probi. 19. 


21. Provar que as retas de regressão de Y para X ede X para Y 


têm suas equações dadas, respectivamente, por: i A . Solução: 
A f No quadro de correlação do Probl. 19, tem-se: . 
= TEY. ey os z TSX EA ] 
a) Y= Y= -> (X — X) e b) X- X= — (Y -X li e 
(0) 1 a Enae sy EN ETT lu = 64,5 „eneo = 70,9 


Solução: 


| y Elyuy o (10) (--55) 
(a) De acórdo com o Probl. 15(a) do Capítulo 13, a reta-de regressão de Y F=B+ey = No” fai 100 = 69,0 
para X tem a equação: 


De acôrdo com os resultados do Probl. 20, sy = 13,906, sy = 14,925 e 


Ja (E q y-F= (5a ) «=P | r = 0,7686. -Agora usam-se os métodos dos Probls. 21(a) e 21(b), para obter as 
Br Za? é equações das retas de regressão. 
E > rsy É (0,7686) (14,925 
Então, como 1 = js o Probl. 10), | (9 y-F = Cm, y opo = SENTO (x 70,9), 
: i 
Em r VSA VBR ony | „ou. Pmt iiy -Y= 69,0 = 082X — 70,9) 
pra Er? -Jsa X i | E : 
Vaz l 0) X-F- Ty 7, xo = CECIN (py 60,0), 
e obtém-se o resultado desejado. E á 

(b) Procede-se como no item (a), permutando-se X e Y. ou . A — 70,9 =0,719(Y — 69,0) 


25. Calcular os erros padrão de estimativa: (a) sy.x; (b) sx.y, 


22. Se as retas de regressão de Y para Xe de X para Y 
para os dados do Probl. 19. Usat os resultados do Probl. 20. 


são dadas, respectivamente, por Y = a F @X e X =b, +bY, 
provar que mb, = 72. 


Solução: 


Solução: (a). spy = sy VI? = 14,925 VI — (0,7686)? = 9,548 
; ayr = SK 7 [TR 
De acórdo com os Probls, 21(a) e 21(b), a = E eb = Fo (è) sxy = sy vi-— = 13,996 V 1 — (0,7686) = 8,934 


Então, ab = (= ) 2x) =: 


“sx? Voy Correlação ordinal 


Ésse resultado pode ser tomado como ponto de partida para a definição de 


26. A tabela seguinte indica de que modo 10 estudantes, dis- 
a coeficiente de correlação linear. 


postos em ordem alfabética, foram classificados de acôrdo com, seus 
aproveitamentos nas aulas de laboratório e de explanação de um 
curso de biologia. Determinar o coeficiente de correlação ordinal 


23. Usar o resultado do Probl. 22 para determinar o coefici- 
ente de correlação linear para os dados do Probl. 1. 


430 A esTanisrres O 


* - Laboratório “|. 


Leitura | 


Solução: ; 
A diferença das classes, D, em laboratório e explanação, para cada estudante, 
é apresentada natabela seguinte. Dela constam, também, D e ZDº. 


Diferença de | 4 9 —i LA 3 1 2 -i ~l p 


classes, D 


Então: 


62 


6(24 
tordim = 1- FeLi O ea) 


10 (10º — 1) 


= 0,8545, 


o que indica que há uma relação acentuada entre os aproveitamentos nas aulas de 
laboratório e de explanação. 


27. Calcular o coeficiente de correlação ordinal para os dados 
do Probl..1 e compará-lo com os resultados obtidos por outros 
métodos. 


Solução: . 
Dispostos em ordem crescente de grandeza, os pesos dos pais são: 
a) g 62, 63, 64, 65, 66, 67, 68, 68, 69, 70, 7L. 


Como o sexto e o sétimo lugares dêsse rol representam os mesmos pesos (67 kg), 
atribuem-se-lhes a ordem média. 0,5. De modo semelhante, atribui-se a ordem 
8,5 ao oitavo e ao nono lugares. Dêsse modo, aos pesos dos pais são atribuídas 


as ordens: 


(2) 1. 1,2,3,4,5,65, 65, 85, 85,10, 11, 12. 


De modo semelhante, os pesos dos filhos, dispostos em ordem crescente de ` 


grandeza, são; 
gr 
e, como o sexto, o sétimo, o oitavo e o nono lugares representam o mesmo pêso 


(68 kg), atribúem-se-lhes a ordem média 7,5 Ke +7 +8 + 94. Dessa maneira, 
aos pesos dos filhos são atribuídas as ordens: 
< 


65, 65, 66, 66, 67, 68, 68, 68, 68, 69, 70,71 


W È, 5, L5, 35, 3,5, 5, 7,5, 7,5, 75, 7,5, 10, 14, 12. 


-var Y4 i 


Usando-se as correspo 


do Probi, 1 torna-se: 


CORRELAÇÃO LAB 


yndências entre (1) e (2) e entre (3) e (4), a Tabela 14.1 


Ordem dos) 4 q 


filhos | 19, 35 


75 15 10 35 75 15 12 5 75 N 


A diferença das ordens, D, e os cáloulos de De ÈD? estão indicados no quadro 


abais 


pet 
-35 “45 LO 


15 15 25 86 35 735 18 25 10 


12,25 2,25 1,00 


Então: 


rordinal = 1 — eo T UŽ- 1) 


2,25 225 6,25 12,25 12,25 12,25 2,25 6,25 1,00 


62Dº 6(72,50) 


= 0,7465, 


que concorda bem com o valor r = 0,7027, obtido nos Probls. 9, 14, 16 ou 23. 


Correlação de séries temporais 


28. Os valores médios dos títulos e ações, relacionados na 
Bôlsa de Valores de New York durante os anos de 1950 a 1959, estão > 


indicados na Tabela 


14.12. (a) Determinar o coeficiente de correla- 


são. (b) Interpretar os resultados. 


Tabela 14.12 


Anos 1950 


— 
1951 | 1952 | 1953 | 1954 1955 | 1956 | 1957 | 1958 | 1959 


Valor médio dos 
titulos (dólares) | 35,22 


39,87 | 41,85 | 43,28 | 40,06 53,29 | 54,14 | 48,12 | 40,71 55,16 


Valor médio das 
agões (dólares) | 102,43 


100,93 | 97.43 | 7,81 "98,82 | 100,07 | 97.08 | 91,59 04,85 | 94,65 


1 


“Fonte: New York Stock Exchange 


Solução: 


ta) Sejam Xe Y 
coeficiente de correlação 


os valores médios dos títulos c das ações. . O cáleulo do 
o pode ser organizado como na Tabela 14.13. Note-se 


que o ano é usado, apenas, para especificar a correspondência entre os valores 


de X.e os de Y. 


Bor DEAL TE SA antsfi 


Tabela 14.13 


É a Y. z=X-F | y=Y-7 s 

35,22 102,43 — 10,04 4,91 100,80 

39,87 100,93 — 5,39 3,41 29,05 

41,85 97,43 —3,41 —0,09 11,63 

43,23 97,81 | —2,08 0,29 4,12 

40,06 98,32 -5,20 0,80 27,04 

53,29 100,07 8,03 2,55 64,48 

54,14 97,08 8,88 —0,44 78,85 

49,12 91,59 3,86 — 5,93 14,90 

40,71 94,85 —4,55 —2,67 20,70 

55,15 94,65 9,89 —2,87 97,81 
EX = BY = 1 xm Ezy= Zy = 
= 452,64 | =975,16 =449,38 | = —94,67 | =93,69 
X =45,26 | F =97,52 j 

=i | 
Então, pela fórmula. de co-variância: 
Eay —94,67 


r = = = — 0,4614 
VE) (449,38) (93,69) 
“(b) Conclui-se que há alguma correlação negativa entre os valores dos títulos 
e os das ações (isto é, uma. tendência para os valores dos títulos'cafrem quando 
os das ações sobem e vice-versa), embora essa relação não seja acentuada. 


““'Quiro método, que utiliza a correlação ordinal (como nos Probis. 26 & 27) 
A Tab. 14.14 apresenta a classificação dos valores médios dos títulos e ações, 


durante os anos de 1950 a 1959, em ordem crescente. Também estão apresenta- 
das na tabela as diferenças das classes, D, e os valores de S D?, 


Tabela 14.14 


TEF = ess 6 
Anos 1950 | 1952 | 1952 | 1953 | 1954 | 1955 | 1956 | 1957 | 1958 | 1959 | 
RR ak 
Preços dos titulos 
em ordem de classo 1 2 5 6 3 8 9 À 4} 10 


Preços das ações 
em ordem de classe 1 9 5 6 7 8 4 1 3 2 


Diferença das i 


classes, D -9| -7| o] 0/-4) of s] èj al 8 
si bent 
D js) s] oj 0/36) of 2] sæ] 1f e] 237 
a Esgoto . 
Então: 
6 D? 272, 
Fordina) = 1 — =1—— cear = — 0,6485. 


N (N? — 1) 10 (10? — 1) 


. capy Tá 


Pode-se, também, proceder mediante a subtração, das variáveis, de constantes 
> 


apropriadas e, depois, adotando-se o segundo método do Probl. 16. 


Correlação não-linear 


29. Ajustar uma parábola de mínimo quadrado da forma 


Y = a + mX + aX ao seguinte conjunto de dados. 


Tabela 14.15 


Solução: 
As equações normais são (veja o Capítulo 13, pág. 362): 


ZXY = MEX +HaDX AE 


IXY = MEX taS X? +a X’ 


EY = aNta?X +X 
(1) { 


As operações necessárias ao cálculo das somas podem ser dispostas como na 


- Tabela 14.16. 


Tabela 14.16 


x Y xº x xY 
RETA 
; 5 48 
1,44 178 2,08 5,40 6, 
wp os| m| ml ge | ni] g7 
x ; 9,61 29,79 92, 7 | , 
io à 78 2401 | 117,65 576,48 38,22 187,28 
5,7 72 | 3249 | 18519 | 105558 41,04 253,93 
ER! 68 | 504 | 35791 | 254,16 48,2 342,19 
3,6 45 | 7396 | 636,06 | 5470,12 38,70 392,82 
9,8 27 941,19 | 9223,66 | 2846 | 259,3 
| : 
E = 2x% | Dx! |axr= |EXF= 
aa Vga = 291,20 | =2 275,35! =18 971,92 | 230,42 | = 1449,00 
nr 


` Então, as equações normais (1) tornam-se, porque N=8: 


42200 + 2912001 + 22753502 = 280,42 
291.2020 + 2.275,35 + 18 971,9202 = 1 449,00 


: Sa + 42,24 + 291,200 = 464 
2) 1 


* de'mínimo quadrado d 


ESTATÍSTICA 


Resolvendo-ms, 8; a = 2,065; a> = — 0,2110. Portanto, a parábola. 


tem, para equação: 


“e Y = 2,588 + 2005X — 0,2110308, 
50. Usar à parábola de mínimo quadrado do Probl, 29, para 
avaliar os valores de Y a partir dos atribuídos a X. 


Solução: 
Para X =1,2, Vest = 2,585 + 2.05 


de modo semelhante, outros valores estimados, Os resultados estão indicados 
na Tabela 14.17, juntamente com os valores reais de Y, ` 


à G Tabela 14.17 


5621 6,962 7,649 7,503 6,613 4741 2561 
O 78 72 6.45 27 


31. (a) Determinar o coeficiente de correlação linear entre as 


variáveis, X'e Y, do Probl. 29. (b) Determinar o coeficiente de 


correlação não-linear entre essas variáveis, admitida a relação pata- 
bólica obtida no Probl, 29. (c) Explicar a diferença entre os coefi- 


cientes de correlação obtida nos itens (a) e (b). (d) Que percen- ` 


tagem da variação total permanece não-explicada, quando se admite 
uma relação parabólica entre X e Y? 
Solução: 
(a) Mediante a utilização dos cálculos anteriormente obtidos na Tabela 
14.16 do Probl. 29, tendo-se ainda em vista que ZY? = 290,52, encontra-se: ` 
Rê ND XY — (EX)(EF) o 
© VINEX -XVI IN Y CY 
= (8) (230,42) — (42,2) (46,4) = — 0,3743. 
. VIB) (201,20) — (42,27) K8) (200,52) — (46,45] Ra 


(b) De acârdo com a Tabela 14.16 do Probl. 29, FP =(EYyN = (45,98 = 
= 5,80. ; sia o dê É 
> Então, a variação total = E(Y — PP = 21,40. si : 
“De acôrdo com a Tabela 14.17 “do 'Probl. 30, a variação 
— F = 21,02: ° 7 As 
Portanto: ` ` 


2 _ Nariaçã explicada 21,02 5 
rie variatio toal 7 a0 7 0,9822 e, 7 = 0,9911 ou 0,99. 


iplicađda = X Yost — 


2) — 0,211002} = 4,762. Ọbiéme, © 


vo Cap dé z TEORIA DA CORRELAÇÃO = E 435 


(o) O fato do resultado do item (a) ser um coeficiente de correlação linear 
ge apenas — 0,3743 indica, praticamente, que não há relação linear entre X e Y. 
Entretanto, há uma boa relação não-linear, fornecida pela parábola do Probl, 29, 


“o qre está indicado pelo fato da correlação linear do item (b) ser 0,99. 


iacão não-explie 7 
(a variação não-explicada |, 2.4. 0,9822 = 0,0178, 


ya riação total 


Por conseguinte, 1,78% da variação total permanece não-explicado. Isso é 
devido a flutuações aleatórias ou a uma variável adicional que não foi considerada 


32. Determinar: (a) sy; (b) sy.x, para os dados do Probl. 29. 


Solução: 
ta) De acôrdo com o Probl, 31a), XY — FY = 21,40. Então, o desvio 
padrão de Y é: : 


Tý 30. 
| is JE =4 dio = 1,636 ou 1,64 


(b) Primeiro método: 


Utilizando os resultados do item (q) e do Probl. 31(b), o êrro padrão da 
estimativa de Y, a partir de X, é: 


sy.y = sy VIDA = 1.636 VI — (0,9911) = 0,218 ou 0,22. 
Ségundo método: 


Utilizando o resultado dó Probi. 31: 


© JEY — Fes)? variação não-explicada 
syy = x = N = 


„02 


— = 0,218 ou 0,22. 


Terceiro método: 


Jtilizando o resultado do Probl. 29 e o cáleulo adicional BF? = 290,52, 


= 0,218 ou 0,22. 


EY? — o ÈY — 1 BX — as BJ 
syy = 7 E 


Teoria amostral da correlação 


“53. Um coeficiente de correlação, baseado em uma amostra de 
tamanho 18, foi calculado como sendo 0,82. Pode-se concluir, nos 


sue ESTATÍSTIG 


níveis de significância: (a) 0,05; (b) 0,01, que o coeficiente de cor- 
relação, correspondente à população, é diferente de zero? 


Solução: 


Desejamos decidir entre as hipóteses: Hop=0ecH:p>O0 


e 082 VIST? 4 x 
VI- (03? ” 


(a) Com hase em um teste unilateral da distribuição de Student, no nivel 
0,05, rejeitar-se-ia, Ho quando t> toss = 1,75, para (18—2)=16 graus de liber- 
dade. Portanto, não se pode rejeitar Ho no nível 0,05. 


(b) Como não se pode rejeitar Ho, no nível 0,05, certamente não se pode re- 
jeitá-lo no nível 0,01. 


34. Qual é o tamanho mínimo de amostra, necessário para que 
se possa concluir que um coeficiente de correlação de 0,32 difere signi- 
ficativamente de zero no nível de 0,05? 


Solução: 


“ No nível 0,05; mediante o emprêgo de um teste unilateral da distribuição de 
Student, o valor mínimo de N devo ser tal que: 


= toos, para N —2 graus de liberdade. 


vi — (032 


Para um número infinito de graus de liberdade, toos = 1,64 e, portanto, 
N = 250 


Para N = 26, v=24, tops = 171, t=032V24)V1 — 0,82} = 1,65: 
Para N=27, v=25 loss = 1,7l, t=0,82 25/V1 — (0,32)! = 1,69. 
Para N =28, v=26 los =171, t= 0,32 2611 — (0,32) = 1,72. 


Então, o tamanho mínimo da amostra é N = 28. 


55. Um coeficiente de correlação, baseado em uma amostra de 
tamanho 24, foi calculado como r = 0,75. Pode-se rejeitar a hipó- 
tese do coeficiente de correlação da população ser tão pequeno quanto: 


(a) p = 0,60; (b) p = 0,50, no nível de significância 0,05? 


E 
E 
í 


CAP. 14 ua 


Solução: - 
a AN 14075) 
(0) Z = 1,1513 log ( 015 ) T0930 
140,60) o aoas 
Ha = 1,1513 log ( 060) — 088. 
1 += 02 
az = — = Dj = 02182. 
VN-3 21 

Então, z = (Z — poJloz = (0,9730 — 0,6932)/0,2182 = 1,28. 


No nível de.significância 0,05, mediante o emprêgo de um teste unilateral da 
“distribuição normal, rejeitar-se-ia a hipótese sômente quando Z fôsse maior do 
que 1,64. Dessa forma não se pode rejeitar a hipótese de que o coeficiente de cor- 
relação populacional seja tão pequeno quanto 0,60. 


(b) Para p = 0,50, uz = 1,1513 log 3 = 0,5493 e z= (0,9730 — 0,5493)/ 
{0,2182 = 1,94. - Então, pode-se rejeitar a hipótese de que o coeficiente de cor- 
relação populacional seja tão pequeno quanto p = 0,50, no nível de significância 0,05. 


36. O coeficiente de correlação entre- os graus finais, em física 
e matemática, de um grupo de 21 estudantes, foi calculado como 
0,80. Determinar os limites de confiança de 95% dêsse coeficiente. 


Solução: 


_ Como r = 0,80 e N =21, os limites de confiança. de 95% de uz são dados por 
Z + 19607 = 1,1513 log (tr) = 1,96 (=) = 1,0986 -+ 0,4620. 
- fes VN 


Então, uz temo intervalo de confiança de 95% de 0,5366 a 1,5606. 
1+9 
I= 


Se uz = 1,1513 log ( ) = 0,5366, p = 0,4904. 


Se uz = 1,1513 iog ( ite 


a = 0,9155 
ite) 1,5606, ` p = 0,9155. 


Assim, os limites de confiança de 95% para p são: 0,49 e 0,92. 


A 37. Dois coeficientes de correlação, obtidos de amostras de 
tamanhos N, = 28 e N: = 35, foram calculados .como 74 = 0,50 e 
ra = 0,30, respectivamente. Haverá uma diferença significativa entre 
os dois coeficientes, no nível 0,05? 


Solução: 
1+rg 
l-r 


Z = 1,1513 jog (EEE a) = 0,5493, Zz = 1,1513 log ( ) = 0,3095 


ir entre as hipóteses Ho: tg = go € He Em É Ege’ 

Para. à hipótese Ho: g 

Zs ~ (uz: — Hz) _, 0,5493 — 0,3095 — O 
Z-Z 0;2669 


= 0,8985. 


Por meio da um teste bilateral da distribuição normal, rejeiter-se-ia Hoy sò- 
“ mente quando z > 1,98 ou z< — 1,96. Portanto, não se pode rejeitar Ho e 
., conclui-se que os resultados não são diferentes, de modo significativo, no nível 0,05. 


Teoria amostral da regressão 


38. No Probl. 1; determinou-se que a equação de regressão 
de Y para X era Y = 35,82 + 0,476X. Testar a hipótese, no nível 
de significância, 0,05, de que o coeficiente de regressão da equação 
de regressão populacional é inferior a 0,180. 


Solução: : 


act p= O Vê = 195, 


Sorrir 1,28/2,6 


porque sy.x = 1,28 (calculado no Probl. 5) e sx = VÈN = V8466/12= 


= 2,66 (no Probl. 2). f 

Com basé' em um teste unilateral da distribuição de Student, no nível 0,05, 
rejeitar-se-ia a hipótese de que o goeficiente de regressão é inferior a 0,180 quando 
t> loos = 1,81, para (12 — 2) = 10 graus de liberdade. Per conseguinte, não 
se pode rejeitar a hipótese. 


39. Determinar os limites de confiança de 95%, para o cocti- 
ciente de regressão do problema anterior. 


Solução: 


VB 
do 41 (obtido fazendo-se é = d fogs = + 2,23, para 12 — 2 = 10 graus de li- 
berdade) são- dados por: ` 


128 NO al a 
r (G «= 0,476 + 0,340, 
n isto é, se €s 


%, confiante de que A, está compreendidotentre 0,136 c 0,816. 


40. Në Probl. 1, determinar os limites de confiança de 95% 
para os pesos dos filhos, cujos pais pesam: (a) 65; (b) 70 kg. 


D CAP lã 


(=x). Então, os limites de Confiança de 95% 


439 


Solução: 


- Como 9975 = 2,23, para (12 — 2) = 10 graus de liberdade, os limites de con- 


` fiança de 95% para Yp(veja a pág. 412) são dados por: 


sy 


em que Yo = 35,82 + 0,476X0 (Probl. 1), sy-x = 1,28, sy = 2,66 (Probl. 38), 
è N = 12., 


(a) Se Xo = 65,0, Yo = 66,76 kg. Também (Xo-F}? = (65,0 — 800/12} = 


= 2,78. Então, os limites de confiança de 95% são: 


2,23 28 
576 + E (1,28) QlIS + 1 + mor = 66,70 de 3,81 kg, 
66,76 + (128) (++ Go 31 kg 


isto é, pode-se estar 95% confiante de que os pesos dos filhos estão compreendidos 
entre 63,4 e 70,1 kg. 

(b) Para Xo = 70, Yo = 69,i4kg. Também (Xo — E) = (70. — 800/12) = 
= 11,11. Então, os limites de confiança de 95% são calculados como 69,14 = 
+ 3,45 kg, isto é, pode-se estar 85% confiante de que os pesos dos filhos estão com- 
preendidos entre 65,7 e 72,6 kg.. 

Note-se que, para grandes valores de W, os limites de confiança de 95% são 
dados, aproximadamente, por Ya + 1,96 8y.x, OU Yo + 25y.x, desde que (Xo= E) 
não seja excessivamente grande. Isso concorda com os resultados aproximados 
mencionados na pág. 258. Os métodos utilizados déste problema prevalecem, in- 
dependentemente do valor de N ou de (Xo — X), isto é, são métodos amostrais 
exatos. 


41. No Probl. 1, determinar os limites de confiança de 95% 
para os pesos médios dos filhos, cujos pais pesam: (a) 65; (b) 70 kg. 


Solução: 


Como togs = 2,23, para 10 graus de liberdade, os limites de confiança de 95% 
para Yp(veja a pág. 412) são dados por: 


22 x EEE 
vão q sx 


= 35,82 + 0,476Xo (Probl. 1), sy- x = 1,28, Sx =2,66 (Probl. 38). 

A ` (a) Para Xo = 65. determinam-se [comparar com o Probl. 40(a)! os limi- 
tes de confiança de 95%, (66,78 == 1,07) kg, isto é, pode-se estar 95% confiante de 
que o. pêso médio de todos os filhos, cujos pais pesam 65 kg, estará compreendido 
“nire 85,7 e 678 bg. 


Yo 4 


$ 


emi que ) 


ESTATÍSTICA 


(b) Paus Xi= 70, determinam-se [comparar com o Probl, 40(0)] os limites 


de confiança de 95%, (69,14 + 1,45) kg, isto € pode-se estar 95% confiante. 


de que o pêso médio de todos os filhos, cujos pais pesam 70 kg, estará compreen- 
dido entre 67,7'e 70,6 Kg. o E 


Problemas Súplemen tares 


Regressão e correlação lineares 


42. A tabela seguinte mostra os dois primeiros graus, representados por X è 
Y, respectivamente, de 10 estudantes em dois Pequenos questionários de biologia. 
(a) Construir um diagrama de dispersão. 
(b) Determinar a reta de regressão de mínimo quadrado de Y para X. 
(co) Determinar a linha de regressão de minimo quadrado de X para Y. 


(d) Representar graficamente as duas rotas dos itens (b) e (e) no diagrama 
de dispersão do item (a). 


Resp: (b) Y =4+0,5X. (c) X = 2,408 + 0,612F. 


Grau do primeiro E 
questionário (X) 658 8 7 6 10 4 9 


~ 


Grau do segundo 
questionário (¥) 8 


=“ 


TIO 5 8 10 6 8 6 


43. Determinar: (a) sy.y; (b) sy-y, para os dados do problema anterior. 
Resp.: (4) 1,804; (Db) 1,443. 


44. Calcular as variações: (4) total de F; (b) não-explicada de Y; (e) ex- 
plicada-de Y, para os dados do Probl. 42. 


Resp: (a) 24,50; (b) I7; (e) 7,50. 


45. Usar os resultados do Probl. 44 para determinar o coeficiente de cor- 
relação entre os dois conjuntos de graus dos questionários do Probl, 42: 
Resp: 0,5533. 


46. (a) Determinar o eneficionte de correlação entre os dois conjuntos de 
graus dos questionários do Probl. 42, mediante o emprêgo de fórmula de co-va- 
riância, e comparálo com o resultado do Probl. 45. (b) Deduzir o cceficiente 
de correlação diretamente das declividades das retas de regressão do Probl, 42 
itens (b) e (e). 

47. Determinar a co-variância para os dados do Probl. 42: (a) direta- 


mente; (b) mediante o emprêpo da fórmula Syy = 1sysy e dos resultados dos 
Probls, 45 ou 46, 


Resp 1,5. 


TEORIA. DA, CORBELAÇ 


48. A tabela seguinte indica as idades, X, e as pressões arteriais, Y, de 12 


. mulheres. 


(a) Determinar o coeficiente de correlação entre Xer.. 
Œ) Determinar a equação de regressão de mínimo quadrado de Y para X. 


(e) Avaliara pressão arterial de uma mulher de 45 anos. 


Idade (X) | 56 42 72 36 63 47 55 49 38 42 068 6 


Pei TO) 147 125 160 118 149 128 150 145 115 140 152 155 


Resp.: (a) 0,8961. (b) Y = 80,78 + 1,138X. (c) 132. 

49. Determinar os coeficientes de correlação para os dados dos problemas: 
(a) 32 do Capítulo 13; (b) 35 do Capítulo 13. 

Resp.: (a) 0,958; (b) 0,872. 

50. O coeficiente de correlação entre duas variáveis, X e Y, ér = 0,60, Se 
sy = 1,50, sy = 2, X = 10 e F = 20, determinar os equações das retas de ro- 
gressão de: (a) Y para X; (b) X para Y. 

Resp.: (a) Y = 0,8X + 12; (0) X = 0,45Y +1 


51. Calcular: (a) syy; (b) sxy, para os dados do Probl. 50. 
“Resp: (W L60; È 120 

52. Se spy =3 e sy = 5, determinar r. 

Resp.: = 0,80 

53. Se o cocficiente de correlação entre X e Y é 0,50, que percentagem da 


variação total permanece não-explicada pela equação de regressão. 
Resp.: 75%- 


gressão de Y para X pode ser 
rever a equação análoga dy reta de 


a equação da reta de 
syylsx? (X — À). 


54. Provar qu 
sob a forma Y — Y 
regressão de X para F. 


E 


55. (a) Calcular o coeficiente de correlação 
entre os valores correspondentes de X e Y, apre- X 2 4 568l 
sentados na tabela anexa. .(b} Multiplicar por „m 
2 cada valor de X da tabela e adicionar 6. 
Multiplicar por 3 cada valor de Y da tabela e 
subtrair 15. Determinar o coeficiente de corre- - — A 
lação entre os dois novos conjuntos de velores e explicar por que se obtém, ou 
não, resultado igual ao do item (a). 


Resp: (a) — 0,9203. 


56. (a) Determinar as equações de regressão de Y para X, para os dados 
nos itens (a) e (b) do problema anterior. (b) Discutir a relação entre 
gs de regressão. aag - 
sta) Y=1804 — 1,34X. . Y =:51,18 — 


58. Provar que um coeficiente de correlação é independente da escolha da, 
“origem das variáveis, ou das unidades em que elas são expressas. (Sugestão: con- 
sidêrar X’ =X +A; Y =Y +B, em que cı c, 4 e B são constantes 
quaisquer, e provar que o coeficiente de correlação entre X’ e Y' é igual ao que 
existe entre X e F.) 


59, Provar que, para a regressão linear, FF = O resultado 
Y 


prevalece para regressões não-lineares ? 
Coeficiente de correlação para os dados agrupados. 


60: Determinar o coeficiente de correlação entre as alturas e os pesos de 300 
homens, nos Estados Unidos, constantes da seguinte tabela de fregiiência: 


Alturas X (metros) 


1,60 —1,68/1,70 —1,78 |1,80 —1,88 | 1,90 —1,98 


Pesos Y (kg) 


Resp: „0,5402. 


6L (a) > Determinar a equação de regressão ‘de mínimo quadrado de Y 
pata X, para os dados do problema anterior. (b) Avaliar os pesos de dois homens, 
cujas alturas são 1,63 e 1,83 metros, respectivamente. 


Resp: s(a) Y = 0,0846X — 1,626, (b) 73,35 e 85,07. 
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62. Determinar: (a) sy.x; (È) sx-y, para os dados do Probl. 60. 
Resp: (a) 10,18 kg; (b) 0,0838 m. 


63. Deduzir a fórmula 21, da pág. 408, para o coeficiente de correlação dos 
dados agrupados. 


Correlação de-séries temporais 


64. Determinar o coeficiente de correlação entre os Índices dos preços para o 
consumidor e por atacado, nos Estados Unidos, de tôdas as utilidades, apresentados 
na tabela seguinte e referidos aos ancs de 1949 a 1958. O período básico é de 1947 
a 1949, correspondente a 100 (veja o Probl. 37, Capítulo 13). 


Anos 1954 | 1955 TAPA 1958 


Índice de preço 
para o consumidor | 101,8 | 102,8 | 111,0 | 113,5 | 114,4 | 114,8 | 134,5 | 116,2 | 120,2 | 123,5 


m rers Do 


Índice de preço 
por atacado 99,2 | 103,3 | 114,8 | 111,6 | 110,1 | 110,3 | 110,7 | 114,3 | 17,6 | 119,2 


Fonte: Bureau of Labor Statistics. 
Resp.: 0,9254. ' 
65. Determinar o coeficiente de correlação para os dados do Probl. 66, 
Capítulo 1. 
Resp.: 0,1608. 


Correlação ordinal 


66. Dois juízes de uma disputa, em que foram solicitados a clássificar 8 can- 
didatos ne ordem de suas preferências, propuseram as escolhas indicadas na ta- 
bela seguinte. Determinar o coeficiente de correlação ordinal e decidir se os juízes. 
estiveram bem concordantes em suas escolhas. 


A B [ol D E Fr G H 


Primeiro juiz | 5 2 8 1 4.6 380 7 


Segundo juiz 4 5 7 E: 2 8 1 ê 


Resp.: rordinal = 2/3. 


67. - Determinar o coeficiente de correlação ordinal, para os dados dos pro- 
blemas (a) 42, (ò) 48. $ 


Resp.: (a) 0,5606; (b) 0,9318. 


68. (a) Determinar o coeficiente de correlação ordinal. para os dados do 
Probl. 55. (b) De acôrdo com a observação do item (a), discutir a possível 
“desvantagem, do método da correlação ordinal.. K 


Resp.: (a) —1. 


69. (a) Determinar o coeficiente de correlação ordinal para os dados do 
Probl. 64. (b) Compará-lo com o obtido naquele problema. 
Resp: (a) 0,7333. 


Teoria amostral da correlação 


70. Foi calculado um coeficiente de correlação de 0,40, baseado em ums 
amostra de tamanho 27. Pode-se concluir, nos níveis de significância (a) 0,05, 
(b) 0,01, que o coeficiente de correlação populacional correspondente é diferente 
de zero? 


Resp.: (a) Sim; (b) Não. 


71, Toi calculado um coeficiente de correlação de 0,50, baseado em uma . 


amostra de tamanho 35. Pode-se rejeitar a hipótese do coeficiente de correlação 
populacional ser: (a) tão pequeno quanto p = 0,80; (b) tão grande quanto 
p = 0,70, adotado o nível de significância 0,05? 


Resp: (a) Não; (èb) Sim. 


72. Determinar os limites de confiança de: (a) 95%; (b) 99%, de um 
"eficiente de correlação de 0,60, calculado para uma amostra de tamanho 28. 


Resp.: (a) 0,2923 e 0,7951; (b) 0,1763 e 0,8361. 


73. Resolver 9 Probl. 72 para o tamanho da amostra de 52. 
Resp.: (a) 0,3912 e 0,7500; (b) 0,3146 e 0,7861. 


74. Determinar os limites de confianga de 95% dos coeficientes de corre- 
lação calculados nos problemas: (a) 48; (b) 60. 
Resp.: (a) 0,7096 e 0,9653; (b) 0,4547 e 0,6158. 


75. Foram obtidos dois coeficientes de correlação de 0,80 e de 0,95 para 
amostras dos tamanhos 23 e 28, respectivamente. Poder-se-ia concluir, nos níveis 
a) 0,05, (b) 0,0t, que há uma diferença significativa entre êles? 


Resp: (a) Sim; (b) Não. 


Teoria amostral da regressão 


76. Com base em uma amostra de tamanho 27, foi determinada a equação 
de regressão de Y para X, Y =25 +2X. Sesyy=15, sy =3e X =7,5, 
determinar cs limites de confiança do coeficiente de regressão de: (4) 05%; (b) 99%. 


Resp: (a) 2 40,21; (b) 2 + 0,28. 


f 
i 
| 
f 


77. No Probl. 76, testar as hipóteses do coeficiente de regressão popula- 
cional ser: (a) tão baixo quanto 1,70; (b) tão alto quanto 2,20, no nível de signi- 
ficáncia 0,01. 

Resp.: (a) Mediênte o emprêgo de um teste unilateral, pode-se rejeitar a 
hipótese; (b) Mediante o emprêgo de um teste unilateral, não se pode rejeitar 
a hipótese. 

78. No Probl, 76, determinar os limites de confiança de: (a) 95%; 
(b) 99%, do valor de F correspondente a X =6. 

Resp.: (a) 37,0 + 3,28; (b) 37,0 + 4,45. 


79. No Probl, 76, determinar os limites de confiança de: (a) 95%; 
(ò) 99%, da médis de todos os valores de Y que correspondem a X =6. 
Resp.: (a) 37 = 0,69; (b) 37 + 0,94. 


a 

80. Com referência so Probl. 48, determinar os limites de confiança de 
95% de: (a) cocficiente de regressão de Y para X; (b) pressão arterial de tôdas 
as mulheres de 45 anos; (c) média das pressões arteriais de tôdas as mulheres 
de 45 anos. i 


Resp.: (a) 1,138 + 0,398; (b) 132 = 16,6; (c) 132 + 5,4 
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Correlação múltipla 


O. grau de relação existente entre três ou mais variáveis é 
denominado correlação múltipla. Os princípios fundamentais im- 


plicados nos problemas da correlação múltipla são análogos aos da 


correlação «simples, estudados no. Capítulo 14. 
 Notação por meio de índices 


Para que se consigam generalizações relativas a grande número 
de variáveis, é conveniente adotar uma notação que implica no em- 
prêgo de índices. x 

Representam-se por X4, Xo, Xa, ..., 48 variáveis consideradas. 

vag s F 
Então, poder-se-á representar por Xi, Xin Xis =. OS valores assu- 
midos pelas variáveis X, e por Xz, Xz» Xas, ... os assumidos pela 
variável X., e assim por diante. Utilizando essa, notação, uma soma 
como Ent Xn + Ka +... + Xay, por exemplo, seria escrita sob 
as formas >, X: 2, Xv; ou, simplesmente, Z X,. Quando não 
ja i 
puder atarretar ambigüidade, usar-se-4 a última notação. Nesse 
LX» 
NT 


de regressão. Plano de regressão 


édia de X, será expressa por E = 


Uma equação de regressão é uma expressão utilizada para avaliar 
uma variável dependente, por exemplo Xı, em função das indepen- 
. e é denominada. equação de regressão de X, para 
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Xa Xo,... Adotada a notação de função, ela é escrita, às vêzes, 


a sob forma abreviada, como X, = F(a Xo .) que se lê “Xé 


uma função de Xa, Xa ete”. , 

No caso de três variáveis, a equação de regressão mais simples de 

X, para X: e X; tem a forma 
Xa = bis + bige Xo + dus Xa (1) 
em que bisa, biza € bss, são constantes. 

Se X, fôr mantida constante na Eq. (1), o gráfico de X, em fun- 
ção de X» será uma linha reta, com coeficiente angular igual a biss- 
Se X, fôr mantida constante, o gráfico de X, em função de Xs será 
uma linha reta, com coeficiente angular igual a bisz É claro que 
os índices colocados depois do ponto indicam as variáveis que se con- 
servam constantes, em cada caso. . 

Em virtude do fato de X, variar parcialmente por causa da varia- 
ção de Xe também por causa da de Xa, buy € biaa serão denominados, 
respectivamente, coeficiente de regressão parcial de X1 para Xa, quando 
X, se mantém constante, e de X, para Xa quando X: se mantém 
constante. ' 

A expressão (1) é denominada. equação de regressão linear de Xu 
para X,e X Em um sistema tridimensional de coordenadas retan- 
gulares, ela representa um plano denominado de regressão, que. é uma, 
genoralização-da reta de regressão, para duas variáveis, considerada 
no Capítulo 13. 


Equações 
drado. 
Assim como há, em um diagrama de dispersão de duas dimen- 
sões, retas de regressão de mínimo quadrado que se ajustaram. a 
um conjunto de N pontos (X, Y) dados, assim também há, em ura 
. diagrama de dispersão tridimensional, planos de regressão de minimo , 
quadrado que se ajustam a um conjunto de N pontos (Xi, X2 Xə 
dados. 
f “O plano de regressão de mínimo quadrado de X, para He Ka 
- é representado pela Eq. (1), em que bras, bis; € bisz SãO determina- 
- dos-mediante a resolução simultânea das equações normais ` 
2X, = bas N + bias ZX: + bie ÈX: 
EX K: Ed [5 ÈX: + biza EX? + dias BEoKs (2) 
EX 1X, = byns EX + bins DXX + bise EX 


Elas podem ser obtidas, formalmente, mediante multiplicação 
de ambos os membros da Eq. (1) por.l, Xze Xa sucessivamente, e a 
somå membro a membro das expressões resultantes. e E 


k ei “A não ser que haja, especificação.em contrário, quando se -fizer 
referência a uma equação de regressão, admitir-se-á que se trata de 
uma de mínimo quadrado. ` 

Se zı XX t2 = X: — Xe ca = X X, a equação de 
regressão de X, para ¥:e X: pode ser escrita mais 
sob a forma 


simplesmente 


z= biza ta + Diz,2 £3 (3) 


em que bima € bia, são obtidos mediante a resolução simultânea das 
equações 


! Erte = Dra Dao? + bina Boszs (a 
Eras = bina Erat + bin Zr 

Estas equações, que são equivalentes às normais (2), podem ser 
obtidas formalmente médiante a multiplicação: de ambos os mem- 


bros de (3) por x» e x, sucessivamente, e a soma membro a membro 
das expressões resultantes (veja o Probl. 8). 


Planos de regressão e coeficientes de correlação 


Se os coeficientes de correlação linear entre as variáveis X, e X, 
Xie Xan Xe Xs, calculadas no Capítulo 14, são representados, res- 
pectivamente, por ris, Tis, Tas (às vêzes denominados coeficientes de 
correlação de ordem zero), o plano de regressão de mínimo quadrado 
tem para equação 

' 


2 
Si 


em que ti = X, nr = Xm An =X 
são os desvios padrão de Xi, Xy e Xa respec 
Probl. 9). 


tivamente (veja o 


Note-se que, se não há a variável X» © se X, = Ye X, = X, a 
Eq. (5) reduz-se à expressão (25) da pág. 408 do Capítulo 14. 


E 


449, 


Êrro padrão da estimativa 


Por meio de uma generalização evidente da Eq. (8) da pág. 404 
do Capítulo 14, pode-se definir o êrro padrão da estimativa de X, por 
meio de X: e X, como 

TE RE 
sys = Etr Kre! 6) 
em que Xi cs Indica os valores estimados de X, calculados por meio 
das equações de regressão (1) ou (5). » 
Em função dos coeficientes de correlação Tın Tis € Tzs, O emo 
padrão da estimativa também pode ser calculado pela fórmula 


+ Rri Tio rm (7) 


As interpretações amostrais do êrro padrão da estimativa para 
duas variáveis, calculadas na pág. 404 para o caso de N ser grande, 
podem ser estendidas a três dimensões, mediante a substituição das 
retas paralelas à de regressão por planos paralelos ao de regressão, 
Uma melhor estimativa do êro padrão populacional da estimativa 


é dada por Su = VNIWN — 3) sum 


O coeficiente de correlação múltipla 


O coeficiente de correlação múltipla é definido. por meio de uma 
extensão das Eqs. (12) ou (14), da página 405 do Capítulo 14, No 
caso de duas variáveis independentes, por exemplo, o coeficiente de 
correlação múltipla é dado por 


(8) 


Do Ma 
=Q1-- 


em que s;.é o desvio padrão da variável Xe Sia é dado pelas expres- 
sões (6) ou (7). A quantidade Kie é denominada coeficiente de de- 
terminação múltipla. 

Quando fôr usada uma equação de regressão linear, aquela quan- 
tidade será denominada coeficiente de correlação múltipla linear. A 
menos que haja especificação em contrário, quando houver referência 
à correlação múltipla tratar-se-á de uma lincar. 


Ri 


(9) 


Um. coeficiente de correlação múltipla, como Ensi, está compre- 
endido entre Q.e 1: Quanto mais próximo de 1, mais bem definida 
serê a relação linear entre as variáveis. Quanto mais próximo de 0, 
menos acentuada ela será. Se o coeficiente de correlação múltipla 
tôr igual a À, e correlação é denominada perfeito. Embora um coefi- 
ciente de correlação nulo indique que não há- nenhuma relação linear 
entre as variáveis, é possível que haja uma não-linear. 


Substituição da variável dependente 


Os resultados acima prevalecem quando X, é considerado como 
variável dependente. Entretanto, se se deseja considerar Xs, por 
exemplo, como variável dependente, em vez de X,, ter-se-ia apenas 
de substituir os fndices 1 por 3 e 3 por 1, nas fórmulas anteriormente 
obtidas. » 

- Por exemplo, a equação de regressão de X; para X) e Xa, 
seria, d q 


Ta Tas ~ Tiarn | T2 Tis — Tara dk 
a (== )z-+( = Da a0) 
3 Tis 2 t=yri „si 
deduzidas da Eq. (5), mediante as substituições rss = 723; Ta = Tsa} 
Ta = Po. 


Generalizações para mais de três variáveis 


São obtidas por analogia com os resultados acima. Por exemplo, 
a equação de regressão linear de X, para X», X, e X, pode ser es- 
crita sob a forma ` 


X: = dr ass + bizza X:+ birza As + bis,23 Xo 0) 
e representa, um hiperplano em um espaço quadridimensional.. Por 
meio da multiplicação formal de ambos os membros da Eq. (11) por 
1, Xz, X; e X., sucessivamente, e depois pela soma membro a membro 
das expressões resultantes, obtém-se as equações normais, parã a de- 
terminação de biss; binas bisa € bigos que, substituídos em (11), 
dá a equação de regressão de minimo quadrado de X; para Xa, X; e X, 
Ela pode ser escrita sob forma semelhante à da Eq. (5) (veja o 
Probl. 41).: 
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Correlação parcial 


-É importante, frequentemente, medir a correlação entre uma 
variável dependente e uma independente particular, quando tôdas 
as outras implicadas se conservam constantes, isto é, quando se 
removem os efeitos de tôdas as outras variáveis (situação frequente- 
mente enunciada pela frase: “tôdas as “outras coisas sendo iguais”. 
Isso pode ser obtido pela definição de um coeficiente de correlação par 
cial, como o da Eq. (12), na pág. 405 do Capítulo 14, exceto que se 
devem considerar as variações explicadas e não-explicadas que 
surgem, tanto com a particular variável independente como sem ela. 

Representando-se r12, O coeficiente de correlação parcial entre 
X, e Xa, conservando-se Xs constante, verifica-se que: i 


Tig — PaT oo (12) 


“QU 


De modo semelhante, sé ri234 é o coeficiente de correlação parcial 
entre X: e Xp conservando-se Xs e X, constantes, então: 


Tiga T Tias Taa (13) 
Q E] (1— Tata) 


Tiza T Tiag Toya 


Va k Tisa) (t= ria) 


T1234 


fisses resultados são úteis porque, por meio dêles, qualquer coefi- 
ciente de correlação parcial pode ser, finalmente, tomado em têrmos, 
dos valores de rı» rz eto. (isto é, dos coeficientes de correlação de 
ordem zero). ] 

No caso de duas variáveis, X e Y, quando as duas retas de regres- 
são têm equações Y = as + a Xek = bo + b: Y, viu-se que 7? = mb; 
(veja.o Probl. 22, do Capítulo 14). sse resultado: pode ser genera- 
lizado. Por exemplo, se 


Xa = byra + diga Xa + drsoa Ka + bias Ka © 449 
E, = byan + banes Xi + banis Ee + banka (15) 


asas z q 
são as equações de regressão lincar de X, para Xa, Xa, Xa e de Xa 
para Xi, Xp e Xa respectivamente, então 


Tu = dis, banza (16) 


(veja o Probl. 18). Isso pode ser tomado como ponto de partida 
para uma definição de cocficientes lineares de correlação parcial, 


Relações entre os coeficientes de correlação múltipla e 
parcial 
Podem ser encontrados resultados interessantes que associem 
os coeficientes de correlação múltipla aos vários coeficientes de cor- 
relação parcial, Por exemplo, determinam-se 
L= Ra =r a7) 
n 2 
1 Rim = (Lo ri ( — Naga) (18) 
s resultados podem ser facilmente obtidas. 


As generalizações dês 


Regressão múltipla não-linear 

Os resultados acima, referentes à regressão múltipla linear, podem 
ser estendidos à não-linear. Podem, então, ser definidos coeficientes 
de correlação múltipla e parcial por meio de métodos semelhantes 


aos acima expostos. 


Problemas Resolvidos 


Equações de regressão que envolvem três variáveis 


1. Adotala uma notação de Índice apropriada, escrever as” 


equações de regressão de: (a) Na para Xi e Xa (b) X: para Xi, X: 
exXs (0) X para Xi Xo, Xs e Xe ? 


Solução: 


2. Escrever as equações normais que correspondem às de ro- 


H 


#12 + bao Xit bani Xa 
a+ biaz X; + Bisas Xs 


1 = byrsa + bissa « 
Solução: 
(e) Multiplica. 
a membro, 


(=: 


E 
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(b) Multiplica-se a equação, sucessivamente, por 1, Xa 
membro a membro. As equações normais são 


Xa c- X4 € sorna-se 


hea N + o o + dia u EXs + biis DX 


Note-se que êsses não são os processos para o estabelecimento das equações 
normais, mas apenas meios formais para recordá-las. As deduções são chtidas 
mais simplesmente mediante o emprêgo do cálculo infinitesimal, como está, indica- 
do no Apêndice VIH. 


O número das equações normais é igual ao das constantes desconhecidas. 
3. A Tabela 15.1 indica os pesos, X,, aproximados até a libra; as 


alturas, Xa, até a polegada, e as idades Xs, até o ano, de 12 meninos. 

(a) Determinar a equação de regressão de mínimo. quadrado 
de X, para Xe Xs. 

(b) Determinar os valores de X, avaliados por meio dos valores 
dados de X e Xu. 

(e) Avaliar o pêso de um menino de 9 anos que tem 54 polegadas 
de altura. 


Tabela 15.1 


so Am 


Idade (o 8. "o 


Solução: 


(a) A equação de regre 
forma 


o linear de Xi para Xy e Ny pode ser escrita sob a 
Xa = bres + birg A2 + bas da 


ás equações normais de mínimo quadrado são 


a) 


As operações necessárias para o cáleulo das somas podem ser dispos como 
na Tabela 15.2. Embora a coluna encabeçada por Ny não seja presentemente 


necessária, cla foi acrescentada pera emprégo futuro, 
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Tabela 15.2 Solução: 


. (a) "A quantidade sı é o desvio padrão da variável X Então, usando-se & 
E Tabela 15:7 do Probl. 3a), determinara-se, pelos métodos do Capítulo 4 


BRO (ZAY 2 faso zay x 
N N o 12 12 i 


8,6035 ou 8,6 libras 


L] 


st 


t 


' EX? EBXy _ [34843 63y 
©. TR z- (F) -4 12 E od Pa 


= 5,6930 ou 5,7 polegadas 


EXE (EE) - gie (106 
© “ "E -=Uw) yn (E) 


= 1,8181 qu 1,8 anos 


RXR = | EXX = | EXX e 
978 40 830 6798 


EXX 
5779 


Usândo a Tabela 15.2, as equações normais (1) tornam-se: 
5. Calcular: (a) ru; (b) ris € (e) res, para os dados do Probl. 3. 


643b2s + 34,843b12,3 + 5,779big,2 = 40 830 


106bias + 5779bzs + 976bma = 6796 Solução: 


(2) o feia + 643bizs + 106bgo = 758 


(a) A quantidade riz é o coeficiente de correlação linear entre as variáveis Xi 


Resolvendo-as, bjx = 3,6512, diga = 0,8546, bss, = 1,5063, e a equação de 
e Xn e sendo ignorada a variável Xg. Então, pelos métodos do Capítulo 14, tem-se 


regressão desejada é 
N ÈXıXa — (EX) (EX) 
VN EXE — EX0 N EX — (EX 
5 (12) (40 830) — (753) (643) DESSE A TOA 
VTO (48 139) — (15897) (012) (84 845) — (643) , 


B) X =3,6512 + 0,8546X2 + 1,5068X4 ou Xi = 3,65 + 0,855X2+1,506X3 } Kes 


Jomo referência a outro método que evita a resolução das equações símultá- 
neas, veja o Probl, 6. ` 


(b) Por meio da equação. de regressão (3), upiém-se os valores estimados de : 
Xy designados por Xi est, mediante à substituição dos valores -correspondentes de ps = 0,8196 ou 0,82 
Xaa Xs Por exemplo, fazendo-se em (3), Xo=57 e X= 8; determina-se “ 


Xion = 64 (b), (c). . Usando-se as fórmulas correspondentes, obtém-se r3 = 0,7698 ou 0,77 


e ra = 0,7984 ou 0,80. 


De modo semelhante obtém-se os outros valores estimados de X, que estão 
relacionados na Tabela 15.3, juntamente com os valores amostrais de Xi 


| 6. Resolver o Probl. 3 (a), usando as Eqs. (5) da pág. 448 e 
os resultados dos Probls. (4) e (5). 


Tabela 15.3 
Solução: ` 


Xy eat (84414 69,136 54,584 73,206 59,286 56,925 65,717 58,229 63,153 48,582 73,857 65,920 


A eguação de regressão de X; para X2e X; é, multiplicando-se ambos os mem- 
bros da Eq. (5), pág- 448, por sı tg 


Da- ( rar 2) (E) o ( ma = rt ) (=) E 
$ L s2 s 


pe 
EEA 


i à 64 mo 53 67 55 58 77 57 58 ši 78 os 


em que x = Xi — E» ao = Ka — Fam = X- Z. Usando os resultados dos 
Probis..4e 5, a Eq. (1) torna-se 


zı = 0,8546029 + 1,5086923 


> 


ESTATÍSTICA 
Como X, = asa = e = 62,750, Ko = ao = 52,583, Fe = 8,833 (da 


bela 15.2 do Probl. 3), a equação desejada pode sex escrita. sob a forms 


X; — 62,750 = 0,8546(X2 — 53,583) + 1,506(X: — 8,838), 
que concorda com o resultado do Probl, 3(a). 

7. Para os dados do Probl. 3, det 
médio do pêso, por polegada de aumento da, altura, para os meninos 


da mesma idade; (b) o acréscimo médio, em péso per ano, para os 
meninos da mesma altura. 


erminar: (a) o seréscimo 


Solução: 
. Na equação de regressão, obtida nos Probls. 3a) ou 6, vê-se que a resposta, 
para (a) é 0,8546 ou, aproximadamente, 0,9 1b, e para (b) é 1,5063, ou cêrca de 1,5 lb. 


8. Mostrar que as Eqs. (3) e (4) da pág. 448 provêm das 
expressões (1) e (2) da pág. 447. 
Solução: 


Na primeira das Eqs. (2) da pág. 447, obtém-se, mediante « divisão de ambos 
os membros por N: 


Coe e r= bags + diga Bo Hbi Es 
Subtraindo-se esta equação da (1) dè pág. 447, obtém-se: 


(O Xi Xi = bus (Xa — Ro) + Ddia(Xo — Fa) ou oy = bieg ta + biog 2o 


que é a Eq. (3) da pág. 448. 


Sejam Xi =x + Xp Xar +a By = +F; nas segunda e ter- 
ceira Eqs. (2) da pág. 447. Então, depois de algumas simplificações algébricas, 
levando em conta os resultados Dzy = Drg = Zr; = 0, elas tornam-se 


(3) Dr = bing Ex? + digo Exata + NÃO bros + bus Xo + bn Xs — Ri) 
(4) Eam = bros Brzeg + diga Zra + NX: [bie + bra Fe + dus Xs — Zi) 


que se reduzem às Eqs. (4) da pág. 448, porque as quantidades entre colehêtes, 
do segundo membro de (3) e (4), são nulas, por causa de Eq. (1). 
Outro método: veja o Probl. 30. 


9. Deduzir a Eq. (5) da pág. 448. 


x T12 713r ES) 
» TD = = 
s Es s2 
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Solução: i 
Pelas Egs. (3) e (4) do Probl. 8 
í bias Bos? + diga Dasry = Direo 


a) 
biga Drozg + bige Dag! = Rares 
Bay? g 
Como e g= “NT Dr? = Note Bag = Nag. 
Como = Zen Dtytg = N S283 
: = , axa = Nsasgryg. 
dá Nososg a Ros 


De modo semelhante, Drita = Ney e Berras = Nasg 
Substituindo em (1) e simplificando, determinam-se: 


disso + bizes rn = sire 
(2) 

bigs sara + brasa = Si 718 ' 
Resolvendo as Eqs. (2) simultâncamente ê 


sa 
Substituindo ésses valores na equação x, = bi, x2 + bino xa Wa. (2) do 
Probl. 8] e dividindo por sy, obtém-se o resultado desejado. 


Êrro padrão da estimativa 


19. Calcular o êrro padrão da avaliação de X; por meio de 
X: 0 Xs, para os dados do Probl. 3, 
Solução: 


Na Tabela 15.3, do Probl. 3(b), tem-se 


Ss = y 3 a! 


[694 — 64,414)? + (71 — 69,130} +... + (6 
12 


= 4,6447 ou 4,6 lb 


O êrro padrão populacional da estimativa é calculado por 


Sa = VNKN — 3) 81,23 = 5,3 lb, neste caso. 


F 2r ri T23 


2 


s F L= = ro = 
lt. Usar a expressão siz = ay aê tz 


Feti 


para obter o resultado do Probl. 10. 


ESTA TÍSUTCA 


Solução: 


. De 2côrdp-com os Probls. 4a).e (5), tem Be Ne Sl 


E +2(0,8106) (0,7608) 0.7984) _ 
1-0, TODE 


sug = 
= lbe" 


Note-se que, pelo método adotado neste paire, o èrro padrão da estima- 
tiva pode sèr determinado sem o uso da equação de regressão. 


Coefic: iente de correlação múltipla 


iz. Cale sular o coeficiente múltiplo de correlação linear de X, 
para X, e Xa, para os dados do Probl. 3. 


Solução: 


Primeiro mastado: De acórdo com os resultados dos Probis, d(a) e 10, tem-se 


n 

ag P8190) + E ose; 

Note-se que à coeficiente de correlação múltipla. Rijas é maior do que qualquer 

dos coeficientes r ou rig (veja o Probl. 5). Isso é sempre verdadeiro, e é um 

fato a ser esperado porque se tomam em consideração variáveis independentes 

adicionais importantes, que podem conduzir a uma relação mais bem definida entre 
gs variáveis, 


O TOR 


13, Calcular o coeficiente de múltipla determinação de x por 
“meio de X, e de Xs, para os dados do Probl. 3. 


Solução: 


, O coeficiente de múltipla determinação de X; por meis de Xp e de X; $ 
Rins = (0,8418) = 0,7086, 


utilizando o resultado do Probl, 12. Em consegüência, cêrca de 71% da va- 
Fiação total de X, são explicados pelo emprêgo da equação de regressão. 


leular (e) Bane (b) Ra, 1, para os dados do Probl. 3, 
e compará-ios com o valor de Fes. 
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. Solução: 


(o) Ra 


(b) Bau = 


0,7984% - “AO, 8196) (0, 7698) (0, 7984) 
1 — (0,8196)* 


= 0,8234 


Este problema ilustre o fato de, èm geral, Rois Rane Rizs não serem neces- 


` sàriamente iguais, como se vê pela comparação com o Probl. 12. 


15. Se Riz = 1, provar que (a) Ran = 1, b) Ryu L 


Solução: 


a) 


(2) 


(a) Fazendo, em (1), Rı,23 = | e elevando ambos os membros ao quadrado, 
T + my — Prerurg=1— LE Então, 


i + rê, = rig ra ros 
2 2 
-2premm=i-r o htir Bome a 


2 
Te Er 
12 ço = 
1 Th 
isto é, R$. a = lou R13 = 1, porque o coeficiente de correlação múltipla é 


considerado não-negativo. 


(b) Ra, = 1 decorre do itera (0), mediante a troca dos índices às 3, no re~ 
sultado Rog = 1. 


16, Se Ri = 0, conclui-se que, necessariamente, Reiu = 0? 


Solução: 
Pela Eq. (1) do Probl. 15, Bjo será nulo sômente quando 


2 2 ra ` ; = pt tê, 
ri t rig — Qmerara = ou Bryr ra = ri tr 


Então, segundo 2 Eq. (2) do Probl. 15, tera-se 


que não é necessàriamente nulo. 


. 460 ; ESTATÍSTICA 


Correlação parcial 
17. Calcular os toefiçientes de correlação parcial linear (a) 


ri (V) rima; (C) 7281, para os.dados do Probl. 3. 


Solução: 
tum nara 


Usando os resultados do Probl. 5 determinam-se ma = 0,5334; mas = 
= 0,3346; 123,1 = 0,4580. 

Segue-se que, para meninos da mesma idade, o cueficiente de correlação entre 
o pêso ẹ a altura é 0,53. Para meninos da mesma altura, o coeficiente de corre- 
lação entre o pêso é a idade:6, apenas, 0,33. Como êsses resultados são baseados 
em pequenas amostras, de apenas 12 meninos, êles não são, naturalmente, tão 
dignos de confiança quanto os que seriam obtidos de amostra maior. 


18. Se Xi=but bims Xodi Xs e XomDadDaaa XatdançÃo 
são as equações de regressão de X, para X,e X:e de X; para Xe Xn 
respectivamente, provar. que Tas = Digo dano. 

Solução: 

A equação de regressão de X para Xz e X, pode ser escrita sob a forma [veja 


a Eq. (5) da pág. 448). 


o aa (E 


+ (1e) (20) o- 
kari s 


A equação de regressão de X; para Xz e Xi pode ser escrita sob a forme. [veja 


a Eq. (10) da pág. 450). 


(2) x- Ra = (OA) 2) o- + 
12 e 


Ly (2} o- Ko 
s1 


LE aae 
+ (eme 


-52 
Ne tio 


De acôrdo com as expressões (1) e (2), os coeficientes de X; e A são, respec- 
tivamente, 


é 


ato, 


rg Tres rg ) (=) 
we 5 
1 Tio 1 


tem-se ryz = fig 723 


rg nam e rag m (713 123) ros 


Vatas) Va- n) 


Ss 
A 
EJ 
s 

di 


(b) Alternam-se os índices 1 e 2, no resultado do item (a). 


Correlação múltipla e parcial com quatro ou mais variáveis 


7207 O exame de admissão a un colégio constou de três provas, 


matemática, inglês e conhecimentos gerais. Para testar a capacidade 
do exame, prédizer o aproveitamento em um curso de estatística, foram 
reunidos © analisados os dados referentes a uma amostra de 200 es- 
tudantes. 

ando-se por 


X, = o grau no curso de estatística, 

X, = o escore no teste de matemática, 

X: = o escore no teste de inglês, 

X, = 0 escore no teste de conhecimentos gerais, obtiveram-se. 
os seguintes cálculos 


24, s = 5, Xa = 15, se = 3, Xu =, 36, s4 = 6, 
ro = 0,90, ra = 0,75, ri = 0,80; ra = 0,70, ra = 0,70, tos = 0,85. 


`a equação de regressão de mínimo quadrado de X, 


ESTATÍSTICA: 


Géneratizândo-se o resultado do Probl; 8, podê-se esgrayer a equação de 
regressão dé aimo quadrado de X; para Xs, Xs e X; sob a forma 


Bayu ro + b ta + binta em que binse bisu e bus 23 podem 
s equações normais 


(G). a 
ser deduzidos 
( Zarar = brasas Dao? + biga Zarza + biza Bom 
o, E! Drs = bisi Daez + byy Da? + bu, Drasta 
$ Dare = bins Bzoes + bisaa Lixa ta + bias Dag 


e em que zı = Xi — Ži, m = Xa — Xyas =X; =fr E 4 — Es 
De acôrdo' com os dados fornecidos, encontra-se 
Da = Neg! = 5000 Zzixz = Nasser = 9000 Danza = Nspsgras = 2 100 
Dust = Nsa = 1800 Eayza = Nsisora = 4500 Baars = Nsgsgra = 4200 
Dr? = Ns = 7200 Dara = Nesgru = 9600 Basra = Nsara = 3 060 
Levando êsses resultados às Eqs. (2) e resolvendo-as, obtém-se 


(3) digas = 1,3333, Duas = 0,0000, bi4,23 = 0,5550, que, substituídos na èx- 
pressão (1), conduzem à equação de regressão desejada. 


(4) . ar = 1,3383x + 0,0000z3 -+ 0,555624 
ou Co MT = 1,33838(X2 = 24) -+ 0,5556(X4 — 27) 
ou . Xi = 22,9999 + 1,3333X + 0,5556X4. 


“Uma solução exata do sistema (2) conduz a bissa = £ , buh e dym= 


= A , de modo que a equação de regressão pode também ser escrita sob a forma 
i 4 5 
(5) X= 2B Hy Kt g Xe 


É interessante notar que a equação de regressão não inclui o escore em in- 
glês, isto é, X3. Isso não significa que os conhecimentos de alguém em inglês não 
tenham importância sôbre o aproveitamento em estatistica. Ao contrário, isso 
significa que a necessidade de inglês, no que diz respeito à previsão do grau de 
estatística, está amplamente evidenciada pelos escores alcançados nos outros 
testes. 


“21. Do estudantes que realizam ò exame de admissão pará o 


colégio dó” Probl. 20, recebem, respectivamente, os escores (a) 30 


em matemética, 18 em inglês e 32 em conhecimentos gerais; (b) 18 
em matemática, 20 em inglês e 36 em conhecimentos gerais. Quais 
seriam seus graus previstos em estatística ? 
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Solução: 
n (e) Fazendo-se X2 = 30, X3 =18 e X4 = 32, na Eq. (5) do Probl, m 
o grau previsto em estatistica é X, = 8 
Es (b) Procedendo-se como no item (a) para X = 18, "Xa = 20 e X = 36, 
determina-se Xı = 67, 


22. Determinar os coeficientes de correlação parcial: (a) Timsu 
(b) riam © (€) Ties, para os dados do Probl. 20. 


“Solução: 
(a), $) rima = En nas ERA, 
Vienan Virpa- 
toa TIATA 


Pma 7 Va -RaR . 
Introduzindo-se os valores do Probl, 20, obtém-se 
ras = 0,7935, riaa = 0,2215, raa = 0,2791. Então, 
A T TRA OS, 


Tuna = MES E E 
Uria) (1 


tiaa) 


= 0,7814 e 


non = — LIA a 0,0000 
x acral- raa) 


Tia — raTa T12 — Tg Tas 


(O rus = amenan enn B E 77. Pia 5: 
Va Bd) Vad) 


T24 — T23 134 


TU ED 
Pio = ri) 


Introduzindo-se os valores do Probl. 20, obtém-se 
ri4,3 = 0,4664, 112,3 = 0,7939, 724,3 = 0,2791. Então, 


mas = 74,3 Tita r243 = 0,4193 
y 2 2 
G— Tiaa) (- raa 

23, Interpretar os coeficientes de correlação parcial (a) ria; 
(b) riaa; (C) rama; (A) rina € (e) ris, Obtidos no Probl. 22. 

Solução: 

(a) rza = 0,7935 representa o coeficiente de correlação (linear) entre os 
graus em estatística e o escore em matemática, para os estudantes que têm o mesmo 
escore em conhecimentos gerais. Na obtenção dêsse coeficiente, cs escores em 
inglês (bem como outros fatôres que não foram levados em consideração) não são 
considerados, como está evidenciado pelo fato do índice 3 ser omitido. 


“Er agd 


(b) ris, = 0,2215 representa o coeficiente de correlação entre os graus em ` 


«estatística e os escores em inglês, para os estudantes que têm-os mesmos escores 


em conhecimentos gerais. Néste caso, não foram considerados os escores em 


“matemática: 


(e) rizza = 0,7814 representa o cceficiente de correlação entre os graus em 
estatística e os escores em matemática, para os estudantes que têm os mesmos 
escores em inglês e em conhecimentos gerais, 

(d) ri43 = 0,4664 representa o coeficiente de correlação entre os graus em 
estatística e os escores em conhecimentos gerais, pars os estudantes que têm os 
mesmos escores em inglês. 


(e) vi4,23 = 0,4193 representa o coeficiente de correlação entre graus em esta- 
tística è escores em. conhecimentos gerais, para os estudantes que têm os mesmos 
escores em matemática e em inglês 


24. (c) Para os dados do Probl. 20, mostrar que: 


(1) Paga — Tiga los | Tags Tu43 Voss 
VA) Eta) “VGA, RL =) 


(b) Explicar a significação da igualdade do item (a). 


Solução: 


(a) O primeiro membro de (1) foi calculado no Probl. 2a), tendo-se 
«obtido o resultado..0,7814.. Para calcular'o segundo membro de (1), .usam-se os. 
resultados do Probl, 22(c) e obtém-se, ainda, 0,7814. Dessa forma, a igualdade 
prevalece neste caso especial. Pode ser demonstrado diretamente, por meio de 
processos algébricos, que a igualdade "prevalece, de modo geral. 


(b) Q primeiro membro de (1) é r12,34 e o segundo é rizez. Como rimas é à 
correlação entre as variáveis X; e Xy, quando X; e X, são mantidas constantes 
enquanto que rizs é & correlação entre Xi e Xo, quando X: e Xg são mantidas 
constantes, é evidente, imediatamente, a razão pela qual a igualdade permanece 
válida. 


25. Determinar (a) o coeficiente de correlação múltipla, Ry,234 
e (b) o êrro padrão da estimativa 81,234, para os dados do Probl. 20. 


Solução: 


(a) ~R, a PC GOKE! - Taa) Q- ae) ou Raaz = 0,9310 


como riz = 0,90, de acôrdo com o Probl. 20, ru 23 = 9,4193, de acôrdo com o 
Probi. 22(c), e 


7-090070) igisi 
E — (0,90)?] E — (0,70 


Ta = 


465 


Qutro método: > 
`A permutação entre os índices x e 4, na primeira equação, conduz & 


~ Ri a(l a) Thad) T o 34)» OU Rouzs = 0,9310, em “que foram 
Ra diretamente os resultados do Probl, 2a). 


mae 4 y a 
(b) Ruam Vis? js? ou spegas -R =10 9910) 


1,234 P 1,234 
= 3,650. 
Comparar com a Eq. (8) da pág. 449. 


Problemas Suplementares 


Equações de regressão que envolvem três variáveis 
26. Adotada uma notação por índice aprppriada, escrever as equações de 
são de (a) Xa para Xie Xo, (b) Xi para Xu Xo, Xze Xs. y 
“Resp: (a) Xa = bsne + bine Xi + bazi Xo, (b) Xa = banas + Davos Xi + 
+ bannas Xo + bagnes Xa + basna Xs 


27. Escrever as equações normais correspondentes às de regressão de 


{a ara Xie Xs; (b) Xs para Xy Xo, Xa e Xy ” 


28. A tabela apresenta os valores correspondentes de três variáveis Xu Xz | 
e-Xa.-(a) Determinar a equação. di ressão de mínimo quadrado | de Xe para 
Xye Xa (b) Avaliar X; para X, = 10 e X: = 6. 


Resp: (a) Xa = 61,40 — 3,854 + 2,54 Xo, (b) 40. 


29. Um instrutor de matemática desejou determinar a relação entre os 
graus de um exame final e os de dois questionários realizados durante o semestre. 
Designando-se por Xy Xz e X; os graus de um estudante no primeiro e se- 
gundo questionários e no exame final, respectivamente, êle fêz os seguintes 
cálculos para um total de 120 estudantes. 


i 


X = 6,8 X: = 70 X: = 74 
s = 1,0 s2 0,89 ss = 9,0 
0,60 rg = 0,70 ra = 0,65 


Li 


nº 


T2 
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(a) Determinar a equação de regressão de mínimo quadrado de ¥; para 
Xie Xr dis ri i 


®), Avaat os graus finais de dois estudantes „cujos escores foram, respecti- 
vamente, Ge 7,.4 e 8 nos dois questionários. i 
Resp.: (0) Xa — 74 = 4,36 (X1 — 6,8) + 4,04 (X2 — 7,0), ou X3 = 16,07 + 
“+ 436X; +.4,04X2; (b) Bt e 66. ` ` 


30, Resolver o Probl. 8, mediant? a escolha das variáveis X3 e Xs, de 
modo que 2X, = DX; = 0, 


Êrro padrão da estimativa 


3i. Determinar o êrro padrão da estimativa de X3 por meio de X; e X», 
para os dados do Probl, 28. 


Resp.: 3,12. 


32. Determinar o êrro padrão da estimativa de (a) Xg por meio de X; e Xz; 
b) Xi por meio de Xz e Xa, para os dados do Probl. 29. 


Resp.: (a) 5,883; (b) 0,6882. 
Cosficiente de correlação múltipla 


33. Calcular o coeficiente de correlação múltipla linear de X4 em função 
de X, © Xn, para os dados do Probl, 28, . 
Resp.: 0,9927. 
34. Caleular (a) Rao, (Ò) Rung e (c) Roxy, para òs dados do Probl. 29. 
Resp.: (a) 0,7567; (b) 0,7255; (c) 0,6810. 
35. Še r= rg = ra =r l, mostrar que Ryn = Roy = Ra = 
PRE 
VIF 


36, Se Run = 0, provar que [ra] = lre] e {ra} 2 {rsl e interpretar. 


Discutir o caso r = 1. 


Correlação parcial 


37. Calcular os cceficientes de correlação parcial linear (a) 712,3; (b) r132 € 
(c) T231 para os dados do Probl. 28 e interpretar as respostas. 


Resp.: (a) 0,5950; (b) —0,8995; (c) 0,8727. 


38. Resolver o Probl. 37, com os dados do Problé29. 
Resp.: (aJMj2672; (b) 0,5099; (c) 0,4028. 


39. Se m = ri = rg =r z 1, mostrar que rig = Ti, = ra = 7/1 + r). 
=L 
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40. Se ros = 1, mostrar que (a) Iriel =; (b) Daal =; (0) Ruz = l; 
(d) sua = 0. 


Correlação parcial e múltipla que envolvem quatro ou mais variáveis 


al Mostrar que a equação de regressão de. X4 para Xi, Xo e X; pode ser 


escrita sob a forma 
z4 ay ( Ea ) EM 
Doai pas Bai as DULLA W D 
sa t (E s2 s3 


em que as az e as são determinados mediante a resolução simultâneamente das 
equações 

arn + ary F aars = 734 

airos + azra + Ggrag = T2 

ary + azr + Garsa = Taa 


e das quais zj = Xj, — Xjrjj = 1, j= 1, 2, 3, 4 Generalizar para o caso de 
mais de 4 variáveis. i 

42. São dados: Xi = 20, Xz = 36, Xs = 12, a = 80, 81'= 1,0, sy = 2,0, 
ss = 1,5, s4 = 6,0, r12 = — 0,20, rig = 0,40, ras = 0,50; r14 = 0,40, r= 0,30, ra= 
= — 0,10. (a) Determinar a equação de regressão de X para Xu Xz € Žo 
(b) Avaliar X4 para Xy = 15, X2 = 40 e Xg = 14. 

Resp.: (a) Xs = 6 X1 +3 X2- 4 Xa — 100; (b) 54. 


43. Determinar (a) ranza; (b) razı e (6) ragna, para os dados do Probl. 42 
e interpretar os resultados. : 

Resp.: (a) 0,8710; (b) 0,8587; (c) —0,8426. 

44: Determinar (a) Raa e (b) s423, pare os dados do Probl, 42. 

Resp.: (a) 0,8947; (b) 2,680. 

45. Um cientista colecionou dados referentes a quatro variáveis 7, t y E 
W. Acreditou que poderia ser encontrada uma equação da forma W = aT ue y , 
em que a, b; c.e d são constantes desconhecidas, por meio da qual se determinaria 
W se fôssem conhecidos T, U e Y. Delinear, com clareza, um processo segundo 


o qual aquéle intento possa ser realizado. (Sugestão: Tomar os logaritmos de . 


ambos os membros da equação). 


| 
| 


Caríruro 16 


ANÁLISE DAS SÉRIES TEMPORAIS 


Séries temporais 


Uma série temporal. é um conjunto de observações tomadas em 
tempos determinados; comumente em intervalos iguais. 

Exemplos de. séries temporais são a produção total anual de 
ago nos Estados Unidos, durante um certo número de anos, o valor 
diário de fechamento de uma determinada ação na Bólsa de 
Valores, as temperaturas horárias anunciadas pelo serviço meteoroló- 
gico de uma cidade, e o total mensal das notas de venda de uma 
loja de departamentos. 


1004 


REBANHO ANIMAL 
DOS ESTADOS uMDOS 
1870-1960 


(Fonte; Ministério da Agricellora ) 


T T f y 
no 1850 1880 3000 1510 
Ano 


Fig. 16-1 


Matemàticamente, uma série temporal é definida pelos valor 


Y, Ya, ... de uma variável Y (temperatura, valor de fechamento de f 


CAP. Jg: ANÁLISE-DAS; SÉRIES TEMPORAIS 469 
uma ação etc.), nos tempos ty, dz ... Portanto, Y é uma função 
„de t simbolizada por Y = Ft). 


Representação gráfica das séries temporais 


Uma série temporal que envolve uma variável Y é representada, 
ilustrativamente, por meio da construção de um gráfico de Y em 
função de t, como foi feito muitas vêzes em capítulos anteriores. (O) 
gráfico da Fig. 16-1 representa os valores de uma série temporal rela- 
tiva ao rebanho animal dos Estados Unidos, durante os anos de 1870 
a 1960. 


Movimentos característicos das séries temporais 


É interessante imaginar que o gráfico de uma série temporal, 
como o representado na Fig. 16-1, é descrito por um ponto que se 
move com o decorrer do tempo, de alguma forma análogo à traje- 
tória de uma parpícula- material que se desloca sob a influência de 
fôrças físicas. Entretanto, O movimento pode ser provocado, em 
vez de fôrças físicas, por uma combinação de fórgas econômicas, so~- 
ciológicas, psicológicas e outras. 


Experiências realizadas com muitos exemplos de séries tempo- 


“tais revelaram certos movimentos “ou variações características, alguns. u 


dos quais, ou todos, estão presentes em graus diversos. A análise 
dêsses movimentos é de grande valor em vários casos, um dos quais 
é o problema da previsão de movimentos futuros. Em consegiiência, 
não deve constituir surprêsa o fato de muitas indústrias e setores 
governamentais estarem profundamente interessados nesse impor 
tante assunto. 3 


Classificação dos movimentos das séries temporais 


Os movimentos característicos das séries temporais podem ser 
classificados em quatro tipos principais, frequentemente , denomi- 
. nados componentes de uma série temporal: 


2. Os movimentos a longo prazo ou seculares referem-se à 
direção geral, segundo & qual parece que O gráfico da série temporal 
se desenvolve, em um longo intervalo de tempo. No gráfico da Fig. 16-1, 
êsse movimento secular, ou, como é às vêzes denominado, 'variação 
mi ten ncia secular, está indicado pela curva de tendência, represen- 
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- tada em linha tracejada. Para algumas séries temporais, pode ser 

adeguada ima reta de tendência. À determinação: dessas retas e 

~ curvas de “tendências, pelo método dos mínimas quadrados, foi con- 
sidêrada nö Capítulo 13. Outros métodos serão examinados a seguir. 


z Os movimentos ou variações cíclicas referem-se às oscila- 
ções a longo prazo ou aos desvios em tôrno da reta ou da curva de ten- 
dência. . Êsses ciclos, como são fregijentemente denominados, podem 
ser ou não periódicos, isto é, podem ou não seguir exatamente pa- 
drões análogos, depois de intervalos de tempos iguais. Nas atividades 
econômicas. é comerciais, os movimentos sômente são considerados 
cíclicos quando ocorrem depois de intervalos de tempo superiores a 
um ano. 

Exemplos importantes de movimentos cíelicos são os denomi- 
nados ciclos de negócios, que representam intervalos de prosperidade, 
recesso, depressão e recuperação. 

Na Fig. 16-1, os movimentos cíclicos em tôrno da curva de ten- 
dência são perfeitamente aparentes. 


Z. Movimentos ou variações por estações referem-se a padrões 
idênticos; ou quase, que. uma série temporal parece obedecer durante 
os mesmos meses de anos sucessivos. fisses movimentos são resul- 
tantes de. eventos periódicos que ocorrem anualmente, como, por 
exemplo, o súbito aumento das vendas de uma lojá de departamentos, 
antes do Natal. 

Na-Fig. 16-1 não aparecem movimentos por estações, porque, 
na obtenção do gráfico, foram utilizados apenas dados anuais. 


Embora os movimentos por estações se refiram, geralmente, à | 


periodicidade anual dos negócios ou das teorias econômicas, as 
idéias nêles implicadas podem ser estendidas, para incluir a periodi- 
cidade relativa a qualquer intervalo de tempo, como a diária, a 
horária, a semanal ete., conforme o tipo dos dados disponíveis. 


4. Os. movimentos irregulares ou aleatórios- referem-se 
; aos desló mentos esporádicos das séries temporais, provocados por 
eventos casuais, como enchentes, greves, eleições ete. Embora; 
“ordinària mente, se admita que êsses eventos produzem variações 
sômente durante curto período, é concebível que elas sejam tão 
intensas que acarretem novos movimentos cíclicos ou de outra na- 
tureza. -|> 
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Análise das séries temporais 

A análise das séries temporais consiste em uma descrição (geral- 
mente matemática) dos movimentos componentes que se apresentam. 
Coma exemplificação dos processos implicados nessa descrição, con- 
siderera-se as Fig. 16-2, que se referem a uma série temporal ideal. 

A Fig. (a) representa o gráfico de uma reta de tendência a longo 
prazo ou secular (poder-se-ia, também, ter usado uma curva de ten- 
dência). A Fig. (b) apresenta essa linha de tendência a longo prazo 


* com a superposição de um movimento cíclico (considerado periódico). 


A Fig. (c) mostra a superposição de um movimento por estações ao 
gráfico da Fig. (b). Se fôssem superpostos ao gráfico da Fig. (c) alguns 

movimentos aleatórios ou irregulares, o resultado apresentaria 

maior semelhança com as Séries temporais que ocor rem na prática. 


- — = - t e t E t 
ta)" Tendôncia a Longo Prazo 1d) Tendência a Longo Praxo o (0) Tendência à Longo Praxo, 
y Movimento Cielica Muvimontos Ciclicos s por 
Estações 


Fig. 16-2 


As idéias acima apresentadas proporcionam uma técnica pos- 
sível para a análise das séries temporais. Admita-se que a var 
riável Y da série temporal é um produto das variáveis T,C,Sel, 
que produzem, respectivamente, os movimentos de tendência, cíclicos, 
por estações e irregulares. Simbôlicamente 


Y=7Tx0x58xI=TCSL (1) 


A análise das séries temporais consiste em uma investigação 
dos fatôres T, C, Se Te é frequentemente classificada, como a decom- 
posição de uma série temporal em seus movimentos componentes 
básicos: 

Dever-se-ia mencionar que alguns estatísticos preferem consi- 
derar Y como a soma T+C+S +I das variáveis básicas envolvi- 
das. Embora seja admitida a decomposição do tipo (1), nos métodos 
dêste capítulo, dispõe-se de processos análogos para O caso em que 
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admite a soma. Na prática, a decisão. acêrca do método de decom- 
posição que deve ser admitido depende do grau de. sucesso o aleançedo 


` com a aplicação da hipótese. a: E o 


Médias móveis. Regularização des s séries temporais 
Dado um conjunto de números: 
Fi Vo Paises (2) 
define-se uma média móvel de ordem N, que é obtida pela sequência 


das médias aritméticas 


Y, + Yat... + Yy Ya + Yit... t Ynn 
N , N , 
Ys + Yat... + Yo i 
eaen o eie € 


3) 


As somas dos numeradores de (3) são denominadas totais móveis 
de ordem N. 


Exemplo 1. Dados os números 2, 6, 1, 5, 3, 7, 2, uma média móvel de ordem 3 
será dada pela sequência 


246410 6414514543 StI 


ikita, i e, 3, 4, 3, 5, 4 


Costuma-se localizar cada número da média móvel em sua posição apropriada 
em relação aos dados originais. Neste exemplo, escrever-se-ia: 


Dodos originais ; 2 6, 1,5,3,7, 2 
Médios móveis de ordem 3 343,5, 4 


cada número da média móvel sendo a média dos 3 dados imediatamente acima dèle 


Se os dados são fornecidos anualmente ou mensalmente, as médias 


móveis de ordem N são denominadas, respectivamente, média móvel. 


de N anos ou de N meses. Por conseguinte, referem-se a médias 
móveis de 5 anos, de 12 meses ete. É claro que pode ser usada 
qualquer outra unidade de tempo. 

As médias móveis têm a propriedade de tenderem a reduzir o 
total da variação que se apresenta em um conjunto de dados. No 
saso das séries temporais, essa propriedade é frequentemente usada 
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para eliminar flutuações indesejáveis e o processo é denominado 
regularização das séries temporais. 

Se nas expressões (3) forem usadas as médias aritméticas pon- 
deradas, sendo os pesos especificados antecipadamente, a sequência 
resultante é denominada média móvel ponderada de ordem N. 

Exeimplo 2. Se forem adotados, no exemplo 1, os pesos 1, 4, 1, à média 
móvel ponderada de ordem 3 é dade pela sequência: 


1(2) +46) + LO) 1(6) +401) + 1(5) 1(1) +4(5) + 1(3) 


1+4+1 à 1+4+1 j 1+h4 +13 É 
1O tA HI 16)+40 +10) 
e 1+4+1 


ou 4,5, 2,5, 4,0, 4,0, 5,5. 


Avaliação da tendência 


A avaliação da tendência pode ser obtida de várias maneiras 
possíveis. 


1. O método dos mínimos quadrados do Capítulo 13 
pode ser usado para determinar a equação de uma reta ou curva de 
tendência apropriada. Pode-se caloulat, por meio dessa equação, os 
valores 1' da tendência. 


2. O método a sentimento, que consiste no ajustamento de 
uma reta ou curva de tendência, mediante a simples inspeção do 


gráfico, pode ser adotado para a avaliação de T. Entretanto, êle 
apresenta a desvantagem evidente de depender considerâvelmente 
do critério individual. 


3. O método das médias móveis. Mediante o emprégo de 
médias móveis das ordens apropriadas, podem ser eliminadas as 
variações cíclicas, estacionais e irregulares, conservando-se, dessa, 
forma, apenas o movimento de tendência, 


Uma desvantagem dêsse método é que desaparecem os dados 
do comêço e do fim da série. Dessa forma, no Exemplo 1 acima, 
parte-se de 7 números e, tomando-se uma média móvel de ordem 3, 
chega-se a 5 números. Outra desvantagem é que as médias móveis 
podem gerar movimentos cíclicos, ou de outra natureza, que não exis- 
tem nos dados originais. Uma terceira desvantagem é que as médias 
móveis são fortemente afetadas pelos valores extremos. Para supe- 
rar de certo modo essa desvantagem, usa-se, às vêzes, uma média 


ara 


ESTATÍSTICA. 


l 
- menores, 


ĝi itens) é atribuído o maior pêso e ãos “Talóres extremos os 


4 O método das semimédias consiste em separar os dados - 


em duas partes (de preferência iguais) e em avaliar a média de cada 
uma, obtendo-se, dessa forma, dois pontos dó gráfico das séries tem- 
porais. desenhada, então, uma reta de: tendência entre êsses dois 
pontos eos valores da tendência podem ser determinados. Os valo- 
res da tendência podem também ser determinados diretamente, 
sem o emprêgo de um gráfico (veja o Probl, 5). 

Embora êste método seja de aplicação simples, êle pode conduzir 
a resultados medíocres, quando usado indiscriminadamente. Tam- 
bém sômente é aplicável quando. a tendência é linear ou aproxima- 
damente linear, embora possa ser estendido 20s casos nos quais os 
dados são grupados em várias partes, em cada uma das quais a ten- 
dência é linear. 


Avaliação das variações por estações. Índice por estação 

Para determinar o fator por estação, S, da Eg. (1) deve-se ava- 
liar de que maneira os dados de uma série temporal variam de mês a 
mês, através de um ano típico. Um conjunto de números que mostre 
os valores relativos de uma var jável durante os meses do ano é deno- 
minado índice por estação da variável. Se, por exemplo, se sabe 
que as vendas, durante os meses de janeiro, fevereiro, março ete., 
foram 50, .120, 90,... por cento da média mensal de todo o ano, os 
números 50, 120, 90,... proporcionam um índice anual por estação 
e são às vêzes designados por números índices por estação. O índice 
médio por estação (a média) correspondente ao ano todo seria de 
100 %, isto é, a soma dos números índices seria 1 200 %. 

Dispõe-se de vários métodos para o cálculo do índice por estação. 

1. O método da percentagem média. Neste método, os 
dados de cada mês são expressos em percentagens da média anual. 
As percentagens dos meses correspondentes; dos diferentes anos são 
balançeadas mediante o emprêgo de uma média ou da mediana: Se 
fôr adotada a média, é melhor que se evitem os s valores extremos que 
possám ocorrer. à ' 

As 12 percentagens resultantes dão o índice por estação. Se sua 
média não fôr de 100% (isto é, se a soma não fôr 1 200%), elas devem 

tadas, mediante sua multiplicação por fatôres convenientes. 


+ pobilerada, com pesos apropriados., Nesses casos, ao item ` 
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2: Método da tendência ou relação percentual, Neste 
- método, os dados de cada môs são expressos em percentagens dos 
“ valores da tendência mensal.. Uma média adequada das percenta- 
gens dos meses correspondentes dá, então, o índice desejado.. Como 
no método 1, elas são ajustadas quando a média não fôr de 100%. 
Note-se que a divisão de cada valor mensal, Y, pelo correspon- 
dents. da tendência, 7, produz o valor Y/T = C SIda Eq. (1). A 
média subsequente dos valores de Y/7 produz os índices por estação 
que podem incluir variações cíclicas e irregulares, especialmente 
quando elas são grandes. Esse fato pode representar uma desvan- 
tagem importante dêste método. 


3. Método da média móvel percentual ou da relação 
entre as médias móveis. Neste método, calcula-se uma média 
móvel de 12 meses: Como os resultados assim obtidos caein entre 
meses sucessivos, em vez de no meio de um dêles, como ocorre com 


os dados originais, calcula-se a média móvel de 2 meses daquela de, 


12 meses. O resultado é fregientemente denominado média. móvel 
centrada de 12 meses. 

Depois disso, os dados originais de cada mês são expressos em 
percentagens da média móvel centrada de 12 meses correspondente. 
Calcula-se, então, a média das percentagens dos meses correspon- 
dentes, que dá o índice desejado. Como anteriormente, êles serão 
ajustados quando não apresentarem a média 100%. 

Note-se que o raciocínio lógico em que se baseia êste método, 
provém da Eq. (1). Uma média móvel centrada de 12 meses dos 
valores de Y presta-se para eliminar os movimentos por estação e 
irregulares, S e Z eé, portanto, equivalente 20s valores dados por TC. 

, Estão, a divisão dos dados originais por TC produz os valores de SI. 
As médias subsequentes para os meses correspondentes prestam-se 
para eliminar a irregularidade 1 e, dessa forma, conduz a um índice S 
conveniente. 


4. O método dos elos relativos. Nestd método, os dados de 
cada mês são expressos em percentagens nos dados do mês anterior. 
Essas percentagens são denominadas elos relativos, porque elas enca- 
‘deiam cada mês ao precedente. Toma-se, então, uma média ade- 
quada dos elos relativos, referentes aos meses correspondentes. 

Dêsses 12 elos relativos médios podem ser obtidas as percenta- 
gens relativas de cada mês, referidas à de janeiro, que é considerada 


“a 
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de 100%. Depois disso ter sido feito, verifica-se, usualmente, que o 


“próximo janeiro tem uma percentagem acumulada, superior ou infe- 


riora 100%, dependendo de ter havido, ou não, acréscimo ou. de- 
eréscimo da tendência. Ao empregar êste método, as várias percenta- 
gens obtidas podem, então, ser ajustadas para essa tendência. As 
percentagens finais, ajustadas de modo a apresentarem a média de 
100%, proporcionam o índice por estação desejado. 


Desestacionalização dos dados 


Se os dados mensais originais são distribuídos de acôrdo com os 
múmeros índices por estações correspondentes, diz-se que os dados 
resultantes estão desestacionalizados ou ajustados à variação por esto- 
ções. fosses dados incluem ainda os movimentos de tendência, cíclicos 


e irregulares. 
Avaliação das variações cíclicas 


Depois dos dados serem desestacionalizados, êles podem também 


“ser ajustados à tendência, mediante sua simples divisão pelos valores 


de tendência correspondentes. De acôrdo com a Eq. (1), o processo 
de ajustamento à variação por estação e à tendência correspondem: 
à divisão de Y para S T, o que dá CI, isto é, as variações cíclicas e 


irregulares. Uma média móvel apr opriada, da duração de uns poucos 


meses (3, 5 ou 7 meses, por exemplo, de modo que a centralização 


subsequente não seja necessária) serve, então, para atenuar as. 


variações irregulares Z e deixar apenas as cíclicas. Uma vez iso- 
ladas, elas podem ser estudadas detalhadamente. Se ocorrer a 
periodicidade (ou a periodicidade aproximada) dos ciclos, podem ser 
idealizados índices cíclicos, de modo muito semelhante ao dos índices 
por estações. ` 


Avaliação das variações irregulares ou aleatórias, 


irregulares ou aleatórias pode ser 
variações de tendên- 


A avaliação das variações 
realizada mediante o ajustamento dos dados às 
cia, por estação e cíclicas. Isso importa em dividir os dados originais 
Y por T, Se C, o que, de acôrdo com a Eq. (1), produz 7. Na prática, 
verifica-se que os movimentos irregulares tendem a ser de pequena 
amplitude ¢ que êles, frequentemente, tendem a seguir o padrão ce 
uma distribuição normal, isto é, aquela na qual os pequenos desvios 
neorrem com grande frequência e os grandes com frequência pequena. 


Comparabilidade dos dados 


„gador, es 
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Deve-se, sempre, ser cuidadoso na comparação dos dados, quando 
éssa providência é justificada, ” 

Por exemplo, ao comparar os dados de março com os de fevereiro, 
deve-se recordar que março tem 31 dias, enquanto fevereiro tem 28 
ou 29 dias. De modo semelhante, ao comparar os meses de fevereiro 
“de anos diferentes, deve-se lembrar que; nos anos bissextos, fevereiro 
tem 29 em vez de 28 dias. Os números de dias de trabalho de vários 
meses do mesmo, ou de anos diferentes, podem, também, ser dife- 
rentes por causa de férias, greves, licenças ete 


Na prática, nenhuma regra definida é seguida para efetuar os 
ajustamentos devidos a essas Variações. A necessidade dêsse ajus- 
“tamento é deixada ao arbítrio do investigador. 


Previsão 


As idéias acima apresentadas podem ser usadas como auxilio 
no importante problema da previsão de séries temporais. Entretanto, 
deve-se compreender que o tratamento matemático dos dados' não 
“resolve, isoladamente, todos os problemas. Conjugada ao bom 
senso, à separadas à habilidade e ao bom julgamento do investi- 
álise matemática “pode, não obstante, ser valiosa, 
o tanto à longo como a curto prazo. 


para a provis 


Sumário das etapas fundamentais na análise das séries 
temporais 


“1, Coletar os dados das séries temporais, fazendo todo o esfôrço 
para assegurar que os dados são fidedignos. Na coleta dos. dados 
deve-se ter sempre em mente a finalidade eventual da análise das 
séries temporais. Por exemplo, se se deseja prever uma certa série, 
-temporal, pode ser conveniente a obtenção de séries temporais cor- 
relatas, bem como outras informações. Se fôr necessário, ajustam-se 
os dados para comparação, isto é, ajustam-se os anos bissextos, ete. 


2. Representar graficamente a série temporal, assinalando-se 
“qualitativamente a presença da tendência a longo prazo e as varia- 
ções cíclicas e por estações. 


3. Construir a curva ou a reta de tendência a longo prazo é 


obter valores adequados da tendência, mediante o emprêgo de um 


; Veis ou 
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dos métodos, dos mínimos quadrados, a sentimento, das médias mó- 
semimédias. a 


Se há variações por estações, obter um índice por estação e 


ajustar os “dados àquelas variações, isto é, desestacionalizar os dados. 


5. “Ajustar os dados desestacionalizados à tendência. Os dados 


resultantes, contêm (tedricamente) apenas as variações cíclicas e 
irregular Uma média móvel de 3, 5 ou 7 meses serve para remover 
as variações irregulares e revelar as cíclicas. 


6. Representar graficamente as variações cíclicas obtidas nà 
etapa '5, anotando quaisquer periodicidades (ou periodicidades apro- 
ximadas) que possam ocorrer. 


7. Mediante a combinação dos resultados das etapas de 1 a 6; 
e utilizando” qualquer outra informação disponível, fazer uma pre- 
visão (se fôr desejada) e, se possível, discutir as fontes de êrro e a 
grandeza, dêste. i 


Problemas Resolvidos 


Movimentos característicos das séries temporais 


1. A que movimento característico de uma série temporal está 
fortemente associada cada uma das seguintes ocorrências ? 


(a) Um, incêndio em uma fábrica, atrasando a produção em 3 


irregular. 


(b) Ums era de prosperidade. 

Resp.: cíclica, 

(e) Uma venda posterior à Páscoa, em uma loja de departa- 
mentos. 

Resp.: por estação! 


td) “A necessidade de aumentar a produção de trigo devido ao 


` aeréscimo constante da população. 


a longo prazo. 


(e) Números mensais de cm da precipitação de chuva, em uma 
cidade, durante um período de 5 anos. 
«por estação. 
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Médias móveis 


«2. A Tabela 161 relaciona a produção média mensal norte- 
-americana de carvão betuminoso, em milhões de toneladas, durante 


os anos de 1948 a 1958. Construir uma (a) média móvel de 5 anos; 


(b) média móvel de + anos; (c) média móvel centrada de 4 anos. 


Tabela 16.1 


T 
Anos | 1948 1949 1950 1951 1952 1953 1954 1955 O56 1957 1958 


Produção média 

mensal de carvão | 
betuminoso 

(milhões “de toneladas) 


50,0 365 43,0 446 389 38,1 32,6 387 417 441 348 


Fonte: Survey of Current Business 


Solução: 


(a) Refere-se à Tabela 16.2 
O primeiro total móvel, 212,9, dá esta 3 éa soma da Lºatéa 5.º casa da co~ 
luna 2. O segundo total móvel, 201, é a soma da 2. “até a 6.º casa da coluna 2 ete. , 


Na prática, depois de obter-se o primeiro total móvel, 212,9, o segundo será 
facilmente obtido mediante a subtração de 50 (1.º casa: da coluna 2) e à soma de 
38,1 (6.º casa da coluna. 2), obtendo-se o resultado 201. Os totais móveis suces- , 
sivos são obtidos de modo semelhante. 


Tabela 16.2 
O 


Movimento | Média móvel 
Anos | Dados total de de 
5 anos 5 anos 

1948 50,0 

1949 36,5 

1950 43,0 212,9 42,8 
1951 44,5 201,0 40,2 
1952 38,9 197,1 39,4 
1953 38,1 192,8 39,6 
1954 32,6 190,0 38,0 
1955 38,7 192,2 38,4 
1956 41,7 187,9 37,6 
1957 41,1 a 

1958 33,8 


Dividindo-se cada total móvel por 5, obtém-se a média móvel desejada. 
(b) Refere-se à Tabela 16.3. ` 


STISPICA 


Os tota 
madas de 


s móveis de 4 anos são obtidos como no item (o, exceto que são so- 
s da colma 2, em vez do 5. Note-se que os totais móveis estão cen- 
los entre os anos sucessivos de modo diferente ao do item (a). Este será 


Considerand 


-se que 1949, por exemplo, começa em 1.º de julho, o primeiro total 
móvel de 4 unos é pentrado em 1.º de janeiro de 1950 ou em 31 de dezembro de 1949. 


Tabela 16.5 


y 


t Movimento | Média móvel 


Anos | Dados total de de 
4 anos 4 anos 
s 1948 | 30,0 
36,5 
43,0 174,0 43,5 
44,5 162,9 40,7 
38,9 164,5 411 
38,1 154,1 38,5 
32,6 148,3 37,1 
E 151,1 37,8 
ál7 154,1 38,5 
411 155,3 38, 
328 É S 


inata ji 


As médias móvei 5 o-se ve 4 
sis de” anos são obtidas divid 
s, dind. p 
se > os totais móveis de 


T (6) Primeiro método: Veja à Tabela 104 

ta leuir-so ndo 

Calcula-se, primeiramente, a média móvel de 4 anos, como no item (b). 
Esses valores : 


o centrados entre. anos sucessivos, como foi demonstrado. 


Tabela 16.4 
7 — É 
Média móvel | Movimento | Média móvel 
Anos | Dados de total de centrada de 
4 anos 2 anos da 4 anos 
coluna 3 (col, 4 + 2) 


1948 50,0 


1949 36,5 
43,0 : 

44 

ss 2a 

38 i 40,9 
E 39,8 

32,6 20,8 

38,7 se 

z 

33,8 3S 
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nd 
re O caso quando um número par de anos fôr tomado para-a média móvel. - 
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Se. agora, se caleular-o total móvel de 2 anos das de 4 anos, os resultados 


estarão centrados nos anos desejados, 
di é 
Dividindo-se os resultados da coluna 4 por 2; obtém-se as desejadas médias 


móveis centradas de 4 anos. 
Segundo método: Veja à Tabela 16.5 
Calcula-se primeiramente, um total móvel de 4 anos, como no item (b). Ñsses 


valores estão centrados entre anos sucessivos, como foi demonstrado. 


Se, agora, se calcular um total móvel de 2 anos désses de 4 anos, os resultados 
tornar-so-ão centrados nos anos desejados. 


Dividindo-se os resultados da coluna. 4 por 8 (2 X 4), obtém-se a média móvel 


desejada. 
Tabela 16.5 

Movimento | Movimento | Média móvel 

Anos | Dados total de total de centrada de 
4 anos 2 anos da 4 anos 
coluna 3 | (col 4 + 8) 

1948 50,0 
1949 36,5 
1950 43,0 174,0 336,9 
1951. 1. 445. 1629: 327,4 
1952 38,9 164,5 318,6 tea 
1953 38,1 154,1 302,4 37,8 
1954 32,6 148,3 299,4 37,4 
1955 38,7 151,1 305,2 38,2 
1956 417 | 154,1 309,4 38,7 
1957 41,1 155,3 
1958 33,8 


3. Mostrar que a média móvel centrada de 4 anos do Probl. Ac) 
é equivalente a uma média móvel ponderada de 5 anos, com os pesos 
1, 2,2, 2, 1, respectivamente. 


Solução: 


Sejam Yı, Ya, ..., Yu 0s valores correspondentes aos anos de 1948, 1940,..., 
1958, respectivamente. Então, procedendo-se como no segundo método do 

. Probl. 2(0), obtém-se a Tabela 16.6. 
o a média móvel centrada de 4 


iguaisa 1, 2,2,2,1. Note-se 


E 


De acôrdo com a última ccluna, segue-se q 
anos ĉa ponderada de 5 anos com os pesos respe 
que 8 é a soma dêsses pesos, istq é 1 + 2 + 2+2+1=8. 
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Tabela 16.6 
Anas |. Movimento total | Movimento total de © | Média” móvel centrada de 
i 2 de 4 anos E da Liso: Ag 
1948| Y, f 
1949 | Ya! 


1950 | Ps rd | FARFAR Yk Fs 


a951 | Ya | Yrkt Yyt Yks | PALA 


1052 | Ys PAIAO | Fit2Y,H2YEk2 Yet Y; 
1953 | Ys | Pip Yst Yot 


1958 Pa 


1 
g AHY 2Y t Fo) 
1 

Outrora ro 


1 
(narrar ro 


_ - md ——- 


Bose método pode sor usado para obter os resultados do Probl, 2(c). Por 


exemplo, a primeira casa (correspondente a 1950) é: 


(1) (50) + (2) (36,5) + (2) (43) + (2) (44,5) + (1) (38,9) 


8 


=421 


4. Representar graficamente a média móvel do Probl. 2(a), 


juntamente com os dados originais. 


Solução: 


, o gráfico dos dados originais está representado, na Fig. 16-3, por meio de uma 
linha cheia. O da média móvel está representado pela linha tracejada. 


som» N 
«o 


Produção em milhões de 
toneladas 


1868 
3349 
1950 + 
1951 
sase d 
2985, 
1954 
3055 + 
1955 


Fig. 16-3 


Note-se'como a média móvel regularizou. o gráfico 
cando claraménte a linha de tendência. 


ns -4 
1958 À 


dos dados originais, indi- 


Uma desvantagem da média móvel é que não são incluídos os dados do início 


não fôr muito grande. 
Eos 


ie temporal. Isso pode ser sério, quando o montante dos dados 


cap. 16 ; ANÁLISE DAS SÉRIES TEMPORAIS 483 . 


a da tendênċia 


.Obter os valores da tendência, para os dados do Probl. 2, 
a o método das semimédias, em que' os valores médios 
adotados forem (a) » média, (b) a mediana, 


Tabela 16.7 


A 


1948 50,2 1954 32,6 
1949 36,5 1955 38,7 
1950 43,0 1956 41,7 
1951 44,5 1957 41,1 
1952 38; 9 1958 33,8 

Total 212,9 Total 187,9 


Médio = 212,9/5 = Média = 187,9/5 = 
= 426 = 37,6 
(correspondente a 1950) (correspondente a 1956) 


Solução: 

(a) Distribuem-se os dados em duas partes iguais (omitido o ano médio, 
de 1953), como está indicado. Calcula-se a média dos dados de cada par te. 

De acôrdo com os resultados obtidos, conclui-se que, em 6 anos (de 1950 a 
1956), houve um decréscimo de 5,0 (42,6 — 37,6) milhões de toncladas, ou de 5/6 = 
= 0,83 milhões de toneladas por ano. i 

Dêsse conhecimento podem ser deduzidos os valores da “tendência, ` Desta 
forma, os valores da tendência, em 1951 e em 1952 são, respectivamente, 
42,6 — 0,83 = 41,8 e 42,6 — 2 (0,83) = 40,9 etc., como está indicado na Tabela 16.8. 


Tabela 16.8 


Anos 1948 1949 1950 1951 1952 1053 1054 1955 1956 1957. 1958 


Vator da tendência 44,3 43,4 42,6 41,8 40,9 40,1 393 386 37,6 36,8 36,0 


Os resultados podem ser também obtidos, mediante o desenho do gráfico de 
uma reta que ligue os pontos (1950, 42,6) e (1956, 37, 6) e a leitura, nesse gráfico, 
dos valores da tendência. $ 

(b) As medianas de cada uma das duas partes do item (a) são 43 e 38,7, res- 
pectivamente. Dessa forma, há um decréscimo de (43-38,7)/6=0,72 por ano, è 
os valores da tendência estão indicados na, Tabela 16.9. 


Tabela 16.9 


Anos 1048 1949 1050 1951 1952 1953 1954 1955 1956 1957 1958 


344 387 380 37,2 


Valor da tendência 444 487 430 423 416 40,8 40,1 
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Quando se utilizam as medianas, o método é frequentemente denominado das 
semimedianas. Se não fôr especificado o tipo do valor médio adotado, fica im- 
plícitó que se trata da média, . 


6. Descrever como seriam empregados os métodos (a) a senti- ` 


mento e (b) das médias móveis para o'cálculo dos valores da tendência, 
para os dados do Probl. 2. ço 

Solução: 

(u) Neste método, simplesmente construir-se-ia, no gráfico do Probl, 4, uma 
reta ou curva que se aproximas 
gráfico seriam lidos, então, os valores da tendência. 


(b) Mediante o uso de uma média móvel de 5 anos, viu-se (Probl, 4) que 
os dados da série temporal foram considerâvelmente regularizados. Podem ser 
usadas as médias obtidas como os valores da tendência, para os anos de 1950 a 
1956. Em consegiiência, de acórdo com o Probl. 2a), viu-se que os valores 
da tendência, correspondentes a 1950, 1951, 1952 ete., são 42,6; 40,2; 39,4 ete. 
Por meio dêste método, entretanto, não se dispõe dos valores da tendência p: 
os anos de 1948, 1949, 1957 e 1958, Se êles são desejados, podem ser obtidos, 
por extrapolação, no gráfico do Probl. 4. 


7. (a). Usar o método dos mínimos quadrados para ajustar 
uma reta aos dados do Probl. 2. 

(b) A partir do resultado do item (a), determinar qs valores da 
tendência. ; 
= Solução: 

(a) Emprega-se o segundo método do Probl. 19(b) do Capítulo 13, porque 
há número ímpar de anos. 


Tabela 16.10 


Anos X Y x XY 
ji 
| 
-5 | 25 —250,0 
-4 | 36 146,0 
-3 9 ~129,0 
-2 4 —89,0 
-1 l —38.9 
1953 0 | 0 0 
1954 1 fa 4 32,6 
1955 2 4 TT, 
1950 3 9 125,1 
1957 | 4 16 164,4 
1958 $ 25 169,0 
! i 
SY = 438,9 3A? =310 | DYXY = 844 


se estreitamente dos dados fornecidos. Nesse | 


“mediante o emprêgo do método das percentagens médias. 
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r=7+(5 


Y 


j=: 


39,9 — 0767 X 


i 


em que a origem X = O corresponde 2o ano de 1953, e a unidade de X é 1 ano. 

(b) Fazendo X = — 5, —4, — 3,:..,5, na equação de mínimo quadrado, 
determinada no item (a), obtém-se os valores da tendência, apresentádos na 
Tabela 16.11. 


Tabela 16.11 


Anos fes 1949 1050 1951 1952 1953 1954 1955 1956 1957 1958 


Os resultados comparam-se favorâvelmente com os do Probl, 5, 
F $ 


Avaliação da variação por estação. Indice por estação. 


8. A Tabela 16.12 apresenta a energia elétrica, em milhões de 
kilowatt-hora, consumida mensalmente para a iluminação de ruas 
e estradas, nos Estados Unidos, durante os anos de 1952 a 1958. (a) 
uir um gráfico dos dados. (b) Obter um índice por 


Tabela 16.12 


Jan, Fev, Mer, Abr. Mai. Jun, Jul, Agô, Set, Out. Nov. Dez. 


1951 | 318 281 278 250 231 216 
1952 309 209 268 249 236 
1955 328 320 287: 269 
32 31 299 
370 334 314 
388 962 34L 
429 393 370 
at 463 423 398 


560 
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Fonte: Survey of Current Business 


(b) Às méd 
1958, são as que sè 


s totais e mensais (média aritmética), para os avos de 1951 a 


ponden- 


Dividindo-se os dados mensais fornecidos pelas médias mensais cn 


«ada ano e e do o resultado em percentagem. obtém-se us casas da 
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Tabela 16.14. 


É sm 
“Êo 
Z. 
= dão | 
3 
320 ENERGIA ELÉTRICA PARA ILUMINAÇÃO DE 
Eai RUAS E ESTRADAS, NOS ESTADOS UNIDOS, 
= NOS ANOS DE 1951 A 1958 
Gde RO RS = q e a a 
Ano 
Fig. 16-4 


Tabela 16.13 


1951 1952 1953 1954 1955 1956 1957 1958 


Totais 3285 3522 3780 ` 4042- 4373- 4738 5090- 5505 


mensais | 273,7 293,5 3150 3368 3644 3048 424,2 458,7 


A percentagem média de cada mês é apresentada na última linha da Tabela 
16.14. O total dessas percentagens é 1 200,1%, que está tão próximo do desejado, 
1200%, que não é necessário nenhum ajustamento. Então, os números da última 
linha representam os índices por estação desejados. 


Tabela 16.14 


Jan. Fev. Mar Abr. Mai. Jun. Jul Agô. Set. Out. Nov. Der | 


1951 | 170,2 1027 101,6 


789 81,5 89,5 98,3 110,3 118,7 126,8 
1952 116,5 105,3 101,9 80,4 82, 89,3 98,1 109,4 116,5 124,0 
1953 116,5 104,1 101,6 79,7 8 90,2 981 109,5 116,5 125,1 
1954 16,4 103,6 101,5 81,1 83,7 9,6 97,4 1081 115,5 123,8 
1955 415,3 108,7 101,5 81,2 837 90,6 97,7 108,7 115,8 124,0 
1956 414,7 104,4 100,8 81,6 849 90,9 993 1082 115,0 122,3 
1957 -114,8 103,7 101,1 81.8 842 915 978 107,7 115,7 121,6 
1958 115,3 104,0 100,9 . 82,8 848 91,3 97,7 1075 114,7/1221 


831,5 810,9 734,2 687,3 647,5 667,5 723,9 7844 869,4 928,4 989,7 


103,9 101,4 91,8 859 80,9 83,4 “00,5 98,1 108,7 116,1 123,7 


9. Obter um índice por estação para os dados do Probl. 8, 
mprêgo do método da tendência percentual ou da relação 


-Por exemplo, a primeira casa da tabela é dada por 318/273,7 = ` 
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da tendência. Ao aplicar êsse método, usar o dos mínimos qua- 
drados para a obtenção dos valores mensais da tendência. 


Solução: 

De acôrdo com os dados reais do Probl. 8a), parece que a tendência a 
lôngo prazo pode ser convenientemente ajustada, por meio de uma linha reta. Era 
vez de obter essa reta por meio dos dados mensais fornecidos, o faremos por meio 
das médias mensais dos anos de 1951 a 1958, apresentadas na Tabela 16.15 e re- 
produzidas na Tabela 16.13 do Probl. 8b). t 


Tabela 16.15 


1951 1952 1953 1954 1955 1956 1957 1958 


Anos 
Média 
mensal 273,7 293,5 3150 336,8 3644 394,8. 424,2 458,7 


Admitindo-se que os dados mensais fornecidos correspondam ao meio do mês, 
as médias dessa tabela referem-se a 30 de junho ou 1.º de julho do ano correspon- 
dente. i 

Tabela 16.16 


meme meme mm À 
GEN y æ x 
1951 =7 278,7 49 . —1915,9 
1952 —5 293,5 25 —1467,5 
1953 -3 315,0 9 —945,0 
1954 -1 336,8 1 —336,8 
1955 1 364,4 1 364,4 
1956. 3 394,8 9 1184,4 
1957 5 424,2 25 2121,0 
1958 7 458,7 4 3210,9 
Al hi 5 
Y = 2861,1 £X’ = 168 ZXY = 2215,5 


A reta de mínimo quadrado desejada é 
= EXYN q _ 2861,1 (Eme 
r=7+ (So) x FR + (gs 


em que X é medido em meios anos, com origem em 31 de dezembro de 1954 


) X = 357,6 + 13,188 X, 


ou 1.º de janeiro de 1955. 


Em vista dessa equação, conclui-se que os valores de Y aumentam de 13,188, 
depois de cada meio ano, ou de 13,188/6 = 2,20 cada mês. Portanto, para X = O 
(1.º de janeiro de 1955), Y = 357,6. Meio mês depois (15 de janeiro de 1955), o 
valor de, Y é 357,6 + 3 (2,20) = 358,7, que é o valor da tendência correspondente 
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a janeiro de 1955. Adicionando-se, sucessivamente, 2,20 a 358,7, determinam-se 
os valores da tendência em fevereiro de 1955, março de 1955 ete., que são 358,7 + 
-+ 2,20 = 360,9; 360,9 + 2,20 = 363,1 ete. De modo semelhante, subtraindo-sê 
sucessivamente 2,20 de 358,7, determinam-se valores da tendência em de- 


sembro de 1954, novembro-de 1954 ete., que são 358.7 — 2,20 = 356,5; 356,5 — ~ 


— 2,20 = 354,3 ete: Dessa maneira, são obtidos os valores da tendência apre- 
sentados na Tabela 16.17, 


Tabela 16.17 


Abr. Mai. Jun. Jul. Agò Sob. Out. Nov. Dez. 


1951 261,9 264,1 266,3 2751 277,3 

1952 288,3 200,5 292,7 301,5 303,7 

1953 314,7 311,9 319,1 7,9 330,1 

1954 BALL 3433 945,5 4 351,3 

1955 3 367,5 369,7 371,9 380,7 382,9 

1956 393,9 390,1 398,3 0 407,1 409,3 ` 
1957 420,3 422,5 425,7 426,9 429,1 431,3 433,5 435,7 


437,9 4423 A445 446,7 448,0 45), 455,5 457,7 459,9 402,1 


Dividem-se,; agora, cada um dos valores mensais, apresentados na Tabela 
16.12 do Probl. 8, pelos valores de tendência correspondentes, encontrados na 
Tabela 16.17., Os resultados, expressos em percentagem, estão lançados na Ta- 
bela 16.18. Por exemplo, a primeira casa da tabela é dada por 318/253,1 = 
= 125,69%. 


Tabela 16.18 


Agô. Set, Out. Nov. Dez. 


Fev. Mor. 


1951 125,0 .110,X 1080 963 882 81,8 837 99,4 110,7 118,1 125,1 
1952 122,4 110,0 105,3 93,7 p4 - 812 82,7 96,9 107,3 113,4 119,9 
1953 120,0 106,5 103,1 91,8 855 792 81,2 95,5 105,9 111,9 119,4 
1954 2180 104,3 1016 9L8 85,0 795 81,6 93,7 203,4 109,8 117,0 
1955 117,1 104,7 101,9 914 85,4 80,1 2,0 94,6 104,0 110,8 118,0 
1956 117,0 206,4 1022 92,4 866 81,3 841 97,3 105,5 111,5 118,0 
1957 118,3 106,4 103,1 940 880 82,1 341 96,7 106,0 113,3 118,4 
1958 120,8 1084 3047 952 89,1 847 86,2 98,4 107,7 114,4 121,2 
Média 119,2 106,4 103,1 930 865 812 83,2 96,8 106,0 112,6 118,0 


Para pbter a percentágerm média de cada mês dos vários anos, foram adotadas 
as medianas, que estão indicadas na última linha da tabola, por causa da presença 
de valores extremos. Como a soma dessas medianas é 1 196,1, clas são ajustadas, 
por meio da multiplicação por 1200/1 196,1, de modo que sua soma seja 1200. 
Dessa maneira, são obtidos os índices por estação desejados, apresentados na 
Tabela 16.19, 


Tabela 16.19 


| 


Jan. Fev. Mar. Abr. Mai. Jun. Jul. Agô. Set. Out. Nov. T 


Índice por 
estação 119,6 106,7 1034 93,3 868 81,5 835 805 971 1063 
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É interessante assinalar que, para os primeiros sete meses, os números índices 
por estação são constantemente maiores do que os obtidos no Probl. 8, enquanto 
que, para os cinco últimos, êles são constantemente menores. 

O índice por estação pode também ser obtido mediante o emprêgo da média, 
em vez da mediana, na última linha da Tabela 16.18. Nesse caso, os valores eX- 
tremos de cada coluna seriam eliminados ao ser calculada a média, 


10. Obter um índice por estação, para os dados do Probl. 8, 
mediante o emprêgo do método da média móvel percentual ou relação 
das médias móveis. 


Solução: 


Obtém-se, primeiramente, uma média móvel centrada de 12 meses, mediante 
é emprêgo do segundo método do Probl. 2(c), que está apresentada na Tabela 16.20. 
Divide-se, agora, cada um dos valores reais mensais pela média móvel cen- 
trada de 12 meses correspondente e exprime-se cada resultado em percentagem. 


Tabela 16.20 


Movi- | Movi- Média ` Movi- | Movi- Média 
mento | mento móvel Ano mento | mento móvel 
total | total | centrada e Da- | total | total | centrada 
de 12 de.2 «de 2 mês | dos |. de..12 de.2..] de 12 
meses | meses meses meses | meses | meses 
da | (col. 4424) feol 4:20) 
col. 3 


DAS 
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Tabela 16.20 (cont) - e extremos em alguns “casos (exemplo: novembro, dezembro). Poderia, também, 


terem sido usadas as médias, mas, nesse caso, os valores extremos de cada coluna 


Movi- TA i Já - | Movii Re +. seriam eliminados. 
Movi- | mento | Média ano by | Moi | mento | Média Rea . Cao ; E 
mento total gentradê E | Da- | total total cond A soma das medianas, 1199,8, é tão próxima da desejada, 1200, que não é 
de 12 2 s | dos dede necessário nenhum ajustamento. Os índices por estação desejados são, portanto, 
aena os apresentados na última linha da Tabela 16.21. 
Os resultados concordam muito bem com os do Probl. 9. 
ar “12. Obter um índice por estação para os dados do Probl. 8, 
ao mediante o emprêgo do método dos elos relativos. 
z 
34 
357 Solução: 
388 ` 
a Primeiramente, exprimem-se os dados de cada mês em percentagem dos do 
a mês anterior, como está indicado na Tabela 16.22, Cada uma dessas percentagens 
| é denominada um elo relativo. Por exemplo, para obter as casas corespondentes 
a fevereiro e março de 1951, tem-se, a partir dos dados do Probl. s 
9428 380,3 "529 10620 
aso | olá? 382,8 477 | 5326 | 10083 i éi = Nelor de fev, 1951 | BL , 
dios 9253 E ás E razão elo relativo de fevereiro de 1951 = valor de jan. 1951 318 = 88,4%; 
4 888, 42 53 10816 y 
is | ds | m ses | Sie | us l or de mar, 1951 278 
4: , 461 | 1 x valor de mar, 
4738 9510 396,2 389 | 5505 elo relativo de março de 1951 = 98,9%. 
4772 gsm 398,8 dio “valor de fev. 1951 Tag 
3800 31 401,3 44 
ssa 2093 “98,9 sm 
4862 758 406,4 
Deu. | 483 | 4891 | 9807 408,6 560 
Tabela 16,22 


Jar. Fev. Mar. Abr. Mai. Jun. Jul. Agô. Set, Out. Nov. Dez, 


Por exemplo, correspondendo a julho de 1951, obtém-se 223/274,7 = 81,2%. Os 
resultados estão apresentados na Tabela 16.21. Note-se que não se dispõe, 


1951 


por êste. método, das casas dos seis primeiros meses de 1951 e dos últimos seis 1982 -98,6 VESE 
de. 1958. ` 1953 100,8 106,4 107,4 
a 1954 99,5 106,9 107,2 

Para obter a percentagem. média de cada mês dos vários anos, foram adotadas ue 100,7 joao 107:1 

as medianas que estão indicadas na Tabela 16.21, por causa da presença de valores 1957 100,8 107,4 105,1 
> 1958 102,5 106,7 106,5 
Mediana | 100,7 106,6 106,6 


Tabela 16.21 


Os valores médios dos elos relativos de vários meses (no caso, as meri- 
disnas) estão representados na última linha da Tabela 16.22. Pode-se, também, 
usar a média (veja o Probl. 12). 


Jan, Fev. Mar, Abr. Mei. Jum. Jul. Agô, Set. Out. Nov. Dez. 


1951 : 81,2 885 96,4 

eds os o o Sos A Soa o 55 ed “Considera-se que janciro tem o valor 100% (veja a Tabela 16.23). Como a 

1984 |, S34 89,6 08,7 “média dos elos relativos de fevereiro é 90,1 (da Tabela 16.22), os dados referentes a 
$ 1955 4 89,5 95,9 AS 5 TARA ; 

1956 $ go oin fevereiro são, em média, 90,1% dos de janeiro, isto é, 90,1% de 100 = 90,1. De 

1958 a | 139,5 107,2 1034 089 877 882 ý ? modo semelhante, a média dos elos relativos de março é 97,6% da de fevereiro, 


isto €, 97,6% de 90,1 = 87,9cte. Dêsse modo, obtém-se a Tabela 16.23, cujas 


“Mediana | 119.8 107,2 1084 93,5 87,2 315 834 89,5 06,4 106,0 1123 10,8 O A 2 E 
> casas são fregientemente denominadas relativas em cadeia. 
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Tabela 16.23 


Jan. Fev. Mar, Abr. Mai, Jun. Jul. Agô. Set. Out, Nov. Dez. Jan. 


109,0 E 87,9. 79,0 747 TOS 72,6 780 85,2 94,7 101,0 107,7 108,5 


Na Tabela 16.23, o resultados do segundo mês de janeiro (última coluna) é 
108,5, com um acréscimo de 8,5 sôbre os do primeiro. Êsse aumento é devido à 
tendência a lohgo prazo dos dados. Para ajustá-lo a essa tendência, deve-se 
subtrair (12/12X8,5) = 8,5 da casa da última coluna (fazendo, portanto, o valor 
do último janeiro igual a 100), (11/12)(8,5) =7,8 do valor de dezembro (10/12X8,5) = 
= 7,1 do valor de novembro ete. Os valores ajustados à tendência estão lançados 
nã Tabela 16.24. 

Rigorosamente falando, dever-se-iam multiplicar as casas, da direita para 
a esquerda, por (100/108,5) °; (100/108,5) 1/12; (100/108,5)1912 ete. Isso, 
entretanto, conduz, praticamente, aos mesmos resultados que os da Tabela 16.24. 


Tabela 16.24 


Jan Fev Mar, Abr. Mai Jun, Jul. Agô. Set. Out. Nov. Dez :> 


1000 89,4 80,5 77,5 719 660 684 736 795 88,3 ` 93,9 99,9 


Como o total dessas percentagens é 995,8, elas são ajustadas mediante sua 
multiplicação por 1200/995,8, para a obtenção dos índices por estação da Ta- 
bela 10.25. a i 

Tabela 16.25 


Jan. Fev, Mar. Abr, Mai Jun, Jul Agô Set. Out. Nov. Dez. 
Índice por 


estação | 120,5 107,7 1042 93,4 860 80,0 824 887 958 106,4 113,2 120,4 


12. Resolver o Probl. 11, adotando a média dos elos relativos, 
em vez da mediana. 


Solução: 


A média dos elos relativos está indicada na Tabela 16.26. 


Tabela 16.26 


Jan. Fev, Mar. Abr. Mai Jun. Jul, Agô Set. Out. Nov. Dez, 


Média 100,4 89,8 970 90,5 936 94,2 103,1 108,5 108,4 110,8 106,8 106,6 


Considerando-se que janeiro tem o valor 100%, o de fevereiro é 89,8% de 
100 = 89,8, o de março 97,6% de 89,8 = 87,6 etc, como está indicado na Ta- 
bela 16.27. 
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Tabela” 16.27 


“Jam. Fev. Mar. Abr. Mai. Jun. Jul. Agô. Set. Out. Nov. Dez. Jan. 


100,0 89,8 87,6 79,3 742 69,9 721 78,2 848 940 100,4 107,0 107,4 


Neste caso, o resultado para o último janeiro é de 107,4, com um aumento, 
devido à tendência, de 7,4 sôbre o do primeiro. Para fazer o ajustamento, sub- 
trai-se (12/12)(7,4) = 7,4 da casa da última coluna, (11/12X7,4) = 6,8 da de de- 
zembro, (10/12X7,4) = 6,2 da de novembro etc., de modo que os valores são os 
apresentados na Tabela 10.28. 


Tabela’ 16.28 


Jam Fê Mar Abr Mai Jun Jul Agô Set Cut Now Dez 


rem net 


100,0 89,2 864 77,5 IT 668 684 739 799 884 942 109,2 


Como a soma das casas da última linha da Tabela 16.28 é 996,6, elas são 
ajustadas mediante sus multiplicação por 1200/996,6 e obtém-se os índices por 
estações constantes de, Tabela 16.29. E 


Tabela. 16.29... 


ramarama ic i 


Jan. Fov. Mar. Abr Mai Jun Jul Agô Set, Out Nov. Dez 


Índice por 
estação 120,4 107,4 104,0 033 868 80,4 82,4 80,0 96,2 106,4 113,4 120,7 


Desestacionalização dos dados 
13, Ajustar os dados do Probl. 8 à variação por estação, 
isto é, desestacionalizá-los. 


Solução: 


Para ajustar os dados à variação por estação, deve-se dividir cada casa dos 


` dados originais do Probl, 8 pelo índice por estação do mês correspondente, 


determinado por qualquer um dos métodos anteriores. 


Se, por exemplo, forem usados os índices por estação -do Probi, 10, divi- 
»dir-se-ão todos os valores de janeiro por 119,8% (isto é, 1,198), todos os de fevereiro 
por 107,2% (isto é, 1,072) etc- Então, os dados desestacionalizados são os epre- 
sentados na Tabela 16.30. 
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ij , Tabela 16.30 


Jan. Fev. Mer. Abr Mai Jun. Jul: Agô Set. Out. Mov. Dez. 


14. (a) Representar, graficamente, os dados desestacionalizados 
obtidos no.problema anterior. 


“(b) Comparar êsse gráfico com o do Probl. 8(a). 
Solução: 
(a) 


soo «| 


aeilhãos do Kilowatthora 


neo 
DADOS DESESTACIONALIZADOS 


awo ~ 


Fig. 16-5 


. (L) Ográfico dos dados ajustados por estação indica claramente a tendên- 
cia a longo prazo que, desprezadas as flutuações secundárias, se aproxima estrei- 
tamente, de ujna linha reta, embora haja uma ligeira tendência para cima. 

Representando-se os dados do Probl. 8 por Y =TCSI, o gráfico do 
item (a) « da variável YjS = TCI, locada em relação ao tempo te, portanto, 
contém ds-mióvimentos de tendência a longo prazo, cíclicos e irregulares.. Como 
o gráfico também indica a tendência a longo prazo, parece que o produto CI, cor- 
respondente aos fatôres cíclicos e irregulares, deve ser, praticamente, 100%. Este 
fato é confirmado no Probl. 16. | 
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Avaliação das variações cíclicas e irregulares 


15. Ajustar os dados do Probl, 13 à tendência, 


Solução: 


Para tornar os dados do Probl. 13 independentes da tendência, divide-se 
cads casa pelo valor da tendência mensal correspondente, calculado por qualquer 
dos métodos considerados. Usar-se-ão, neste caso, os valores mensais de tendência 
obtidos, no Probl. 10, pelo método das médias móveis. Os resultados estão in- 
dicados na Tabela 16.31. Para obter a casa correspondente a julho de 1951, por 
exemplo, divide-se a casa correspondente, 267, da Tabela 16:30 do Probl. . 13, 
pelo valor 274,7 (veja o Probl. 10, primeira casa da coluna 5 da Tabela 16.20), o 
que dá 267/2747 = 97,2%. As outras casas são obtidas de maneira semelhante. 
Uma desvantagem dêste método, como de todos os que envolvera as médias mó- 
veis, é que desaparecem os dados de ambas as extremidades das séries temporais. 


Tabela 16.31 


Jan. Fev, Mar Abr Mai Jum Jul. Agô. Set. Out. Nov. Dea. 


1951 . 97,2 99,0 100,0 101,6 102,4 102,2 
1952 99,9 100,4 100,2 99,0 981 990 98,5 978 100,3 101,1 101,2 100,4 
1953 100,6 100,1 100,5 992 080 982 98,4 997 100,4 101,0 30Li 105,1 
1954 99.9 99,1 100,1 100,2 90,7 99,7 100,0 100,2 99,2 09,4 9,8 100,1 
1955 100,1 100,1 100,9 100,0 100,0 100,0 100,1 100,1 99,4 100,1 200,3, 100, 
1956 99,4 100,3 99,9 99,7 100,0 100,4 101,5 100,6 101,4 99, 99,4 98,9 
1957 99,1 99,3 100,0 100,7 101,0 100,8 100,5 101,1 99,5 99,1 100,0 98,0 
1958 99,9 100,0 100,0 100,3 100,5 102,0, 


16. (a) Representar, graficamente, os dados obtidos no 
Probl, 15. 


(b) Explicar o significado do gráfico. 


Solução: 


(a) Convém subtrair 100% dos dados do problema anterior e representar, 
graficamente, os desvios resultantes. O gráfico obtido, mediante a adoção de uma 
escala vertical grandemente ampliada, está representado na, Fig. 16-6. 


(b) Os dados originais são representados por Y = TOSI. Seu ajustamento 
à variação por estação, como foi feito no Probl. 13, importa em dividir ambos 
os membros pelo índice por estação S, obtendo-se. Y/S = TCI. O ajustamento 
subsegiiente à tendência corresponde à divisão por T, obtendo-se FIST = CI. A 
subtração de 100% conduz a YjST — 100 = CI — 100. Por conseguinte, & 
variável dependente da Fig. 16-6 é YIST — 100 e a independente é o tempo é. 

O gráfico é composto, tedricamente, apenas de movimentos cíclicos e irregu- 
lares, representados pelos fatóres correspondentes C e I, respectivamente. Note-se 
que o produto CI varia entre 97 e 103%, o que confirma a exposição feita no 
fim do Probl, 34; ` 
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+3 


VARIAÇÕES cícLicas E 
IRREGULARES 


Desvio Percentual om Relação 3 100% 
i 
E 


-2f 


antoi as aana anai oaan aaan sasana asasan aan aaas aad 9997 | 3958 —4 
k Ano 


Fig. 16-6 
— 17. (a) Obter as médias móveis de 3 e de 7 meses, para os dados 
do Probi: 15. E dE De 
(b) Construir os gráficos das médias móveis do item (a). 
(c) Interpretá-los, 
Solução: 
(a) As médias móveis desejadas estão lançadas na Tabela 16.32, 


Tabela 16.32 


7 

Ano Movimento Média Movimento Média 
e Dados total de móvel de total de móvel de 

mês 3 meses 3 meses 7 meses 7 meses 

1951 

Jul, 97,2 

Agô, é 99,0 296,2 98,7 

Set, 100,0 300,6 100,2 

Out, 101,6 304,0 191,8 702,3 100,3 

Nov. 102,4 306,2 102,1 705,5 100,8 

Dez. 102,2 804,5 101,5 706,7 104,0 

s 
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Tabela 16.52 (cont.) 
Movimento Média Movimento Média 
* Dados total de | móvel de total de móvel de 
3 meses 3 meses |. 7 meses 7 meses 
99,9 302,5 100,8 705,7 100,8 
100,4 300,5 100,2 702,2 100,3 
100,2 299,6 99,9 698,8 99,5 
99,0 297,3 99,1 695,1 99,3 
98,1 296,1 98,7 693,0 99,0 
99,0 295,6 98,5 692,9 99,0 
98,5 295,3 98,4 693,8 99,1 
97,8 296,6 98,9 696,0 99,4 
100,3 299,2 99,7 698,3 99,8 
101,1 302,6 100,9 699,9 100,0 
101,2 302,7 100,9 701,5 100,2 
100,4 302,2 100,7 704,2 100,6 
1953 
Jan, 100,8 301,1 100,4 703,1 100,4 
Fev. 100,1 301,2 100,4 700,9 100,1 
Mar. 100,5 299,8 99,9 697,9 99,7 
Abr. 99,2 298,6 99,5 695,9 99,4 
Mai. 98,9 296,3 98,8 695,0 99,3 
Jun. 98,2... 295,5 985 695,3 99,3 
Jul. 98,4 296,8 98,8 695,8 “99,4 
Agô. 99,7 298,5 99,5 697,7 99,7 
Set. 100,4 301,1 100,4 699,9 100,0 
Out. 101,0 "302,5 100,8 701,6 100,2 
Nov. 101,1 303,2 101,1 702,3 100,3 
Dez. 101,1 302,1 100,7 702,7 100,4 
1954 
Jan. 99,9 300,9 100,3 702,5 100,4 
Fev. 99,1 299,1 99,7 701,2 100,2 
Mar. 100,1 299,4 99,8 699,8 100,0 
Abr. 100,2 300,0 100,0 698,7. 99,8 
Mai, 99,7 299,6 99,9 699,0 99,9 
Jun 99,7 299,4 99,8 699,1 99,9 
Jul. 100,0 299,9 100,0 698,4 99,8 
Agô. 100,2 299,4 99,8 698,0 99,7 
Set. 99,2 298,8 99,6 698,4 99,8 
Out. 99,4 298,4 99,5 698,8. 99,8 
Nov. 99,8 299,8 99,8 698,9 99,8 
Dez. 100,1 300,0 100,0 699,6 


age. 
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Tabela 16.52 (cont) 


ESTATÍSPICA 
Tabela 16.32 (cont.) 
Ano Movimento| Média “| Moviment édi 
NA > Dados total de móvel de total de ° Eyri “as 
mês 3 meses 3 meses 7 meses 7 meses 
1955 > 
Jan. "| 1001 300,3 100,1 700,4 
Fov. 100,1 304,1 100,4 701,0 100% 
dor. | 100,9 301,0 100,8 701,2 100,2 
Abr. |. 100,0 300,9 100,3 701,2 100,2 
Mai. 100,0 300,0 100,0 701,2 100,2 
Jun. 100,0 300,1 100,0 700,5 100,1 
Jul, 100,1 300,2 100,1 699,7 100,0 
Agô. | 100,1 299,6 99,9 699,8 100,0 
Set, 99,4 299,6 99,9 699,8 100,0 
Out. 100,1 299,6 99,9 699,2 100,0 
Nov. 100,1 300,2 100; 699,4 100,0 
Dez. 100,0 299,5 99,8 699,2 100,0 
1956 
Jan. 99,4 299,7 99,9 
Fev. 100,3 299,6 99,9 Sosa 1000 
Mar 99,9 299,9 100,0 699,7 100,0 
99,7 299,6 99,9 701,2 100,2 
Mai. | - 100,0 300,1 100,0 702,4 100,3 
Jun. 100,4 301,9 100,6 703,5 100,5 
Jul, 105,5 302,5 100,8 703,4 100,5 
Agó. 100,6 302,5 100,8 703,1 100,4 
Set. 101,4 301,8 100,6 702,0 100,3 
Out: 99,8 300,6 100,2 700,7 100,1 
Nov. 09,4, 298,1 99,4 698,5 ` 99,5 
Dez. 98,9 297,4 99,1 697,9 99,0 
1957 
Jan. 99,1 297,3 99,1 o 
Fev. f 99,3 298,4 99,5 96 968 
Mar. 100,0 300,0 100,0 699,8 100,0 
Abr. 100,7 301,7 100,6 701,4 “100,2 
Mai. | 1010 302,5 100,8 703,4 100,5 
Jun. 100,8 202,3 100,8 708,6 100,5 
Jul, 100,5 302,4 100,8 702,7 100,4 
Agô. 101,1 30,1 100,4 702,0 100,3 
Set 99,5 299,7 99,9 699,0 99,9 
"Out fh e 991 298,6 99,5 898,1 997 
Nov. |” 1000 297,1 99,0 897,6 99,7 
Dez. |. 980 2907,9 29,3 698,5 99,5 


Ano Movimento Média Movimento) Média 
e Dados total de | móvel de | total de | móvel de 

mês 3 meses 5 meses 7 meses 7 meses 

1958: | 

Jan. 99,9 297,9 99,8 697,3 99,6 
Fev. 100,0 299,9 100,0 698,7 99,8 
Mar. 100,0 300,3 100,1 700,7 100,1 
Abr. 100,3 300,8 100,2 

Mai. 100,5 302,8 100,9 

Jun. 102,0 


(b) Como no Probl. 16, convém subtrair 100% das médias móveis e repre- 
sentar graficamente os desvios resultantes, como está indicado abaixo. 


wkd 
R MÉDIA MÓVEL DE 3 MESES 


Desvio Porcanh 
Em Rolação o 100% 
d 
j 


L 


po assi 92e pere 1989 meen þa 1988 ee eaae 1968 meea ja 1986 aea 0: aT a | 


Ano 


Figo 16-7 
Ro MÉDIA MÓVEL DE 7 MESES 
VS ZE 


PPP E SRS O RR O RO RR a SA 


Desvio Percontual 
Em Relação a 140% 


Fig. 16-8 


tc) Como é de esperar, as médias móveis servem para atenuar as irregulari- 
dades dos dados do Probl. 15, o que é evidenciado pela comparação dos gráficos 
do item (b) com o do Probl. 16, É clero, também, de acôrdo com o gráfico, 
que a média móvel de 7 meses proporciona, neste caso, melhor regularização dos 
dados do que a de-3 meses. 

É interessante assinalar que os 3 máximos, à esquerda, e os dois mínimos, 
à direita, dos gráficos do item (b), ocorrem todos nas proximidades de dezembro. 
Também, os dois mínimos, à esquerda, e og dois máximos, à direita, ocorrem nas 
proximidades de junho. Essas observações parecem indicar pequenas variações 
por estação residuais, no comêço e no fim do periodo de 8 anos, que agem em di- 
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reções opostas, o que indica, portanto, uma possível alteração do padrão por estação. 
Ao longo do período-total de 8 anos essas alterações seriam naturalmente cancela- 
das. O pequeno resíduo por estação existente seria posteriormente evidenciado 
quando se tomasse uma média; móvel centrada de 12 meses. 

Ordinariamente, o método dêste problema é adotado para os padrões cíclicos. 
Esperar-se-ia que fósse êste o caso porque, se os dados originais, fornecidos por 
Y = TOSI, são ajustados à tendência e à variação por estação, obtém-se novos 
dados, VIST = CI, que (tedricamente) contém apenas os movimentos cíclicos e 
irregulares. Uma média móvel conveniente, então, serve para eliminar as irregu- 
laridades e revelar o padrão cíclico, quando existir. Para éste fim, talvez seja 
melhor uma média móvel centrada de 12 meses, porque elimina as variações por 
estação residuais, bem como as irregularidades. 


No problema. presente, nenhum efeito cíclico parece estar presente ou, se estiver, 
é desprezível. Na teoria econômica, são necessários, frequentemente, dados de 
20 anos de duração, pelo menos, para que os ciclos apareçam (veja a Fig. 16-1). 


l Comparabilidade de dados 


18. Como seriam modificados os dados do Probl. 8, de modo 
a que sejam deduzidos os anos bissextos de: 1952 e 1956? 

Solução: 

Em um ano bissexto, fevereiro tem 29 dias em vez de 28. Para conseguir a 


comparabilidade dos dados, multiplicam-se os dados correspondentes 20 mês de 
fevereiro de um ano bissexto por 28/29. Então, na” Tabela 16.12 do Prob. 8: 


O valor de fevereiro de 1952 é substituído por (28/29) (309) = 298. 
O valor de fevereiro de 1956 é substituído por (28/29) (412) = 398, 
Essés ajustamentos não foram feitos na obtenção dos índices por estação 


(veja o Probl. 8.11). Seus efeitos. sôbre os resultados, entretanto, são des- 
prezíveis (veja o Probl. 52). 


Previsão 


19. (a) Utilizando-se os dados da Tabela 16.12 do Probl. 8, 
Prever o consumo mensal de energia elétrica mensal para a ilumina- 
ção de ruas e estradas, nos Estados Unidos, durante o ano de 1959. 
(b) Comparar os valores previstos com os reais, 

Solução: 

(a) Os futuros valores mensais são dados por Y = TOSI, em que se pode. 
avaliar T,0,Se I. 

Para avaliar a tendência T, podem ser empregados vários métodos possíveis. 
De acôrdo com o gráfico do Probl. 14 (veja a Fig. 16-5), parece que se estaria 
habilitado a obter estimativas suficientemente precisas dos valores da tendência 
futura, mediante o ajustamento de uma reta aos valores da tendência dos dois 
últimos anos, por exemplo. Isso pode ser feito pelo emprêgo do método dos mínil 
mos quadrados ou de qualquer outro dos que têm sido estudados. 
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. £orrespondente a junho, de. 1958, podem ser obtidos os 
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Poder-se-ia obter os valores da tendência pelo método relativamente simples 
das semimédias, aplicado aos resultados obtidos no Probl. 10. Na tabela 


a abaixo, distribufram-se em duas partes iguais as médias móveis centradas de 12 
- meses; correspondentes aos meses de julho de 1956 a junho de 1958. 


Tabela 16.33 


Jul. 1956 396,2 Jul, 1957 425,9 
Agô. 1956 398,8 Agô. 1957 429,2 
Set. 1956 401,3 Set. 1957 432,2 
Out. 1956 403,9 Out. 1957 434,8 
Nov. 1956 406,4 Nov. 1957 437,2 
Dez. 1956 408,6 > Dez. 1957 439,8 
Jan. 1957 410,6 Jan. 1958 442,5 
Fev. 1957 412,7 Fev. 1958 445,1 
Mar, 1957 414,9 Mar, 1958 447,8 
Abr. 1957 417,1 Abr. 1958 450,7 
Mai. 1957 419,9 Mai. 1958 458,6 
Jun. 1957 422,8 Jun. 1958 458,9 

Total 4913,2 Total | 5295,7 

a 
Média 409,4 Média 441,3 


De acórdo com as médias dos dados de cada parte, conclui-se que houve um 
acréscimo de 441,3 — 409,4 =: 31,9, em 12'meses, ou de 31,9/12 = 2,66, por mês. 

Mediante a adição; sucessivamente, de 2,66 a 456,9, último valor disponível, 
tendência. em. 
1959, como estão indicados na terceira linha da Tabela 16.34(a), abaixo. 

Para avaliar o fator por estação, S, utilizam-se os índices por estação obtidos 
no Probl, 10, embora possam ser usados, também, os determinados por outros 
métodos. Êsses índices por estação foram repetidos na quarta linha da Tabela 
16.34(0). 


Tabela 16.34(a) 


Jan, | Fev. | Mar | Abr. | Mai. | Jun. | Jul. | 4gó, | Set, | Out. | Nov. | Dez. 
2 


Valores da 

tendência $ $ E a laria 

de 1958 | 456,9 | 459,6 | 462,2 | 404.0 | 467,5 |170; 3 

Valores da 

teissa? | ers, | 478,2 | 480,8 | 488,5 | 486,2 | a88,8 | 401,8 | 405,1 | 408,8 | 400,6 | 5021 re 
2 à é JE E al Ee 


ARo ES 119,8 | 107,2 | 103,4 | 93,5 | 87,2) 81,5] 83,4] 89,5] 96,4 | 106,0 | 112,8 | 119,6 


em 
Potência 

Bsotrxso | s70) 513] 497| 452] a24) 398| ao) 442) ato] 520] 564) sos 
(milhões de 

kw-h) 
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De.acôrdo com a Fig. 16-6 do Probl. 16, vê-se que a estimativa dos fatôres 
cíclicos e irregulares, CI, diferem de 100% de menos de 2,5%. Portanto, admi- 
tindo-so que-CI = 100% = 1, isto é Y =T XCXSXRI =(P X SXC X D) = 
=T xS o'desvio de Y não seria superior a 2,5%. 

Multiplicido-se os valores de 7 em 1959 pelos coniespondentes de S$ (recor- 
dando-se que $.está em percentagem), obtém-se os valores mensais previstos ou 
Projeções para 1959, apresentados na última linha da Tabela 16. 340), na página 
antetior. "Por exemplo, o valor previsto para. janeiro de 1959 é (475,5) (1,198) = 
= 570 ete. 


(b) Vê-se que os valores mensais reais, para o ano de 1959, apresentados na 
“Tabela 16.340); abaixo, concordam suficientemente bem com os previstos. 


Tabela 16.34) | 


Jan. Fev. Mar Abr. Mai Jun. Jul, Agô, Set. “Out. Nov.” Des, 


Potência real 

em 1959 563 509 497 454 424 404 415. 446, 478 524 561 594 
(milhões de 9 
kw-h) 


Porte: Survey of Current Business 


Problemas Suplementares 


Movimentos característicos das séries teraporais 


20. A que movimentos característicos de uma série temporal seriam direta- 
mente associados cada um dos seguintes eventos: (a) uma recessão; (b) um 
acréscimo de empregos durante os meses de verão; (c) o declínio da taxa de mor- 
talidade resultante do progresso da ciência; (d) uma greve na indústria do aço; 
(e) uma procura continuamente crescente de automóveis pequenos. 

Resp.: (a) cíclicos; (b) por estação; (c) tendência a longo prazo; (d) irre- 
gular; (e) tendência a longo prazo, 


Médias móveis 


21. Dados os números l; 0; — 1; 0; 1; 0; — 1; 0; 1, determinar uma 
média móvel'de ordem (a) dois, (b) três, (c) quatro, (d) cinco. 
Resp.: 


(a) 0,5; —0,5; —0,5; 0,5; 0,5; — 0,5; —0,5; 0,5. 
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22. Prover que, se uma seqüência de números tem período N (isto é, à sê 
quência se repete depois -de N têrmos), cada média móvel de ordem inferior a A 
tem, então, período iguala N. Ilustrar com referência ao Probl, 21. 


* 23. (a) No Probl. 22, o que acontecerá no-caso da médis móvel de ordera 
N? (b) Que acontecerá se a ordem fôr superior à N? Tlustrar com referência ao 
Probl. 24. 


24. Provar que, se cada número de ums sequência fôr aumentado (ou dimi- 
nuído) de uma constante, a média móvel será também aumentada (ou diminuída) 
dessa constante. 


25. . Provar que se cada número de uma seqüência fôr multiplicado (ou divi- 
dido) por uma constante diferente de zero, a média móvel será tambéra multipli» 
cada ou dividida por essa constante. 


26. Determinar a média móvel ponderada dos números do Probl. 21(b), (c) 
e (d), para os pesos respectivos de: (b) 1;2;1; (9 1;2;2; 1; (d ;2;2;2; 1. Core- 
parar com os resultados do Probl. 21. 


Resp: (b) O; — 0,5; 0; 0,5; 0; = 0,5; 0. Obtidos -45 
= $ i (@ 0; 0; 0; 0; 0. 


27. (a) Demonstrar as propriedades das médias móveis ponderadas, enuncis- 
das nos Probls. 24 e 25. (b) O resultado do Probi. 22 prevalece para as módias 
móveis pondêradas ? 


28. Uma segiência tem (a) 24; (b) 25 e (c) 200 números. Quantos 
números haverá em uma média móvel de ordem 5? 
Resp.: (a) 20; (b) 21; (c) 196. 


29. Uma segiiência tem M números. (q) Provar que, em uma média móvel de 
ordem N, haverá M — N +1 números. Ilustrar por meio de diversos exemplos, 
adotando valores diferentes de M e N. (b) Discutir o caso em que M sN. 


30. A Tabela 16.35 apresenta o consumo médio mensal, em milhares de 
fardos, do algodão produzido e importado nos Estados Unidos, nos 8mos de 1949 
a 1958. Calcular as médias móveis (a) de 2 anos; (b) centrada. de 2 anos 
(c) de 3 anos; (d) centrada de 4 anos; (e) centrada de 6 anos. 


Tabela 16.35 


Anos 1949 1950 1051 1952 1953 1954 1955 1956 1957 1958 


Consumo de algodão i 
nos Estados Unidos 656 804 838 765 777 TIL 755 747 6898 dra 
(milheres de fardos) 


Fonte: Survey of Curreat Business 
Resp.: 


(a) 730, 820, 800, 771, 744, 733, 751, 722, 686. 
(b) 775, 810, 786, 758, 738, 742, 736, 704. 
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(c) 765, 802, 798, 751, 748, 738, 733, 707. 
(d) 780, 784, 762, 750, 737, 723. 
(e) 766, TTO, 753, 734. =“ ` A 


31. Representar graficamente as médias móveis do Probl. 30, juntamente 
com os dados originais, e discutir os resultados obtidos. 


32. (a) Mostrar que a média móvel centrada de 2-anos do Probl. 30(b) 
é equivalente a uma ponderada de 3 anos, com os pesos 1, 2, 1, respectivamente. 
Hustrar por meio do cálculo numérico direto. (b) Mostrar que a média móvel 
centrada de'6 anos do Probl. 30(e) é equivalente a ums ponderada conveniente. 


33. (a) Para os dados do Probl. 30, determinar uma média móvel pon- 
derada de ordem 3, quando forem adotados os pesos 1, 4,17 (b) Representar 
gràficamente essa média. móvel e compará-la com a do Probl, 30(c). 

Resp.: (0) 785, 819, 779, 704, 729, 746, 740, TOL 


34. A Tabela 16.36 apresenta as vendas totais mensais de uma fábrica, em 
milhares de carros de passageiros, nos Estados Unidos, durante os “anos de 1953 
a 1958. Construir as médias móveis (a) de 12 meses; (b) centrada de 12 meses; 
tc) centrada de 6 meses. Para os itens (b) e (c), representar graficamente a média 
móvel, juntamente com os dados originais e comparar os resultados. 


a 


Tabela 16.36 


E Fev. Mar, Abr. Mai Jun. , Jul. Agò. Set, Out Nov, Dez, 


195% 452,6 485,3 506,1 595,8 548,3 585,7 596,0 512,7 476,2 528,8 378,9 389,6 

1954 454,6 446,7 631,5 5847 497,1 5071 4517 445,3 301,0 221,2 498,2 669,9 

1955 635,6 677,7 791,3 753,4 7211 647,7 658,7 620,6 467,8 505,2 746,0 695,1 

1956 5910 560,9 583,2 552,9 474,0 445,8 441,0 417,0 203,9 352,1 576,7 617,6 

1957 628,0 570,0 585,7 541,7 537,1 406,3 484,7 521,3 3183 291,1 583,8 555,2 

1958 478,4 396,2 359,5 322,5 352,1 342,2 316,4 195,0 102,7 272,2 511,9 608,7 
Fonte: Survey of Current Business 


Avalia da tendência 


35. Obter os valores da tendência, pare os dados do Probl. 30, adotando-se 
à método das semimédias, em que os valores médios adotados são (a) a média; 
(b) a “medias, Construir um gráfico que ilustre os dados obtidos. 

Resp.: 


(a) 788, 778, 768, 758, 747, 737, 127, 717, 707, 697. 
(b) 803, 790, 777, 764, 751, 737, 724, 711, 698, 685. 
36. Resolver o Probl. 30, mediante o emprêgo de (a) método a sen- 


timento; (b) média móvel de uma ordem conveniente. Comparar com os re- 
sultados do Probl. 35. 


37. (a) Usar o método des mínimos quadrados para ajustar ums reta 208 
dados do Probl. 30. 
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(b) Em vista dos resultados do item (a), determinar os valores da tendência. 


, Compará-los com os resultados dos Probis. 35 e 36, 


Resp: i 


(a) Y = 742,4 — 3,358X, em que X é dado em meios-anos e a origem corres- 
ponde & 1.º de janeiro de 1954. $ 
(6) 758,0; 754,7; 751,3; 747,9; 744,6; 741,2; 737,9; 734,5; 731,1; 727,8. 


38. (a) Ajustar uma parábola da forma Y= ao + aX + aX? aos dados 
do Probl. 8, adotando as médias móveis da Tabela 16.13 do Probl: 9. (b) Com- 
parar o resultado do Rem (a) com a reta de mínimo quadrado do Probl. 9 
e calcular os valores da tendência. ` 

Resp.: i 

(a) Y = 351,1 + 13,188X + 0,311Xº, em que X é medido em unidades de 
mejo-ano, com a origem correspondendo a 1.º de janeiro de 1955. 


39. Obter os valores da tendêndia, para os dados do Probl, 34, mediante 
o emprêgo (a) do método das semimédias; (b) do método a sentimento; (c) de 
uma média móvel centrada de 12 meses; (d) de uma curva de mínimo quadrado 
apropriada (para encontrá-la, utilizár o gráfico dos dados originais, construído 
no Probl. 34). Discutir as vantagens e desvantagens de cada método. 


Avaliação das variações por estação. Índice por estação 


40. A Tabela 16.37 apresenta à produção mensal das fábricas de manteiga, 
nos Estados Unidos, em milhões de libras, durante os anos de 1951 a 1958, (a) 
Representar. graficamente -os dados. .. (b) Calcular um índice por estação, mediante 
o emprêgo do método das percentagens médias. Ajustar os dados dos anos” 
bissextos, antes de obter êsse índice. . 


Tabela 16.37 


Jan. Fev. Mar. Abr. Mai, Jun. Jul. Agô Set. Out. Nov. Dez, 


1951 85,6 80,9 2,6 141,2 130,5 119,0 93,6 86,6 684 70,4 
1952 787 788 O 128,0 117,7 105,7 92,1 87,7 ,750 94,6 
1953 103.9 101,9 56,0 154,0 135,6 118,7 95,0 91,6 91,3 109,0 
1954 118,7 116,6 164,5 160,9 129,7 109,4 92,6 87,8 868 970 
1955 108,1 104,3 157,9 151,9, O 102,1 919 94,7 927 105,8 
1956 114.6 14,1 151,9 149,0 127,6 100,8 924 93,1 923 108,4 
1957 115,3 110,3 159,3 .148,1 125,8 106,9 90,1 100,3 94,1 105,7 
1958 118,6 113,4 150,6, 144,7 126,9 97,7 86,7 91,9 90,0 107,2 


Fonte: Survey of Current Business 


41. Obter um índice por estação para os dados do Probl. 40, mediante o 
emprégo do método da tendência percentual ou da relação da tendência, Para 
obter os valores da tendência, ajustar uma curva de mínimo quadrado, apropriada 
às médias móveis dós anos dados. 


42. Obter um índice por estação para os dados do Probi. 40, mediante o 
emprêgo do método da média móvel percentual ou de relação das médias móveis. 
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43. Obter um f 
emprâgo do-método dos c 


dès, sin s do dólares, 
durante os anos de 1951 a 1958. 
indico por estação, mediante 


44.:“A Tabele 16.38 apre 

` de tódas as lojos varejistas dos Estados U 

(a) Representar graficamente os dados. (b) Obte 
o emprêgo. do método das percentagens médias. 


Mar. Abr. 


dàn, Fev, 


1 
14,08 1 
13,78 15 


Fonte: Survey oi Current Busineas 


“48 Obter um índice por estagõo pera os dados do Frobi. 44, 
emprêgo do método da tendência y roentual ou de relação da tendência. 


pum ds sosdianto O 


nóveis, 


«6. Obter um índice por este 
emprêgo do método da relação das médios 


silos do Probl. 44, mediante o 


4y. Obter um índice por estação pai 
esaprêgo do método dos elos relativos, 


o transporte fervoviário de merca- 
vagões, durante os nãos de 1051 & 
(b) Obter ura Índico por estação, 


édias. 


48. A Tabela 16.20 apresenta c volum 
Aoriaa, nos Estados Unidos, em milhares de 


Survey of Current Business 


49. “Resolver o Probi, 48 pele método 


50. Resolver o Probl. 48 pelo método à 


51 Resolver o Probi. 48, pels método dos elos relativos. 


Drm 


y 
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(a8; (Db) 9; (0) 10 e (d) 11, usan- 
ssexto e determinar se o ajustamento tem 
va sôbre os indices finais por estação obtidos. 


qdo os dados ajustados 
algama, influência aigui 


53, (e) Culevlar um índice por estação para os últimos c os primeiros 4 anos, 
para os dados do Probl. & mediante o emprègo de qualquer método, (b) Com- 
parar os dole Indices obtidos e explicar qualquer diferença que houver. 


dados do Probl. 40, mediante a utilização de 
qualquer índice por estação, obtido nos Probis, 40 a 43. (b) Representar gràli- 
dados despstacionalizadus e explicar os resultados. 


l 55. (a) Ajustar os dados do Probl. 44"à variação por estação, usando 
qualquer dos resultados dos Probls. 44 a 47. (b) Representar graficamente os 
dados ajustados das estações e interpretar os resultados obtidos. 


56. (a) Desestacionalizar os dados do Probl. 48, usando qualquer” dos 
índices por estação dos Probls. 48 a 51, (b) Representar graficamente os dados 
ajustedos das estações e explicar os resultados obtidos. 


Avaliação das variações cieli irregulares 


57. (a) Ajustar os dados do Probl. 54 em relação à tendência, mediante 
o emprêgo de qualquer método. (b) Representar graficamente os dados obtidos. 


` (e) Tomar uma média taóvel de 3 ou 5 meses dos dados do item,(q). (d) Repre- 


sentar graficamente o9 resultados do ítem (c), explicando as variações observadas e, 
em particular, apontando a existência de qualquer movimento cíclico que possa 
haver. 


58: A Tabela 16.40 apresenta a produção média. mensal das fábricas de man- 
teiga, nos Estados Unidos, em milhões de libras, durante os anos de 1930 » 1958. 
(a) Representar gràfi ato os dados e discutir a existência possível de ciclos. 
(b) Comparar os resultados obtidos no item (a) com as conclusões enunciadas no 
“Probl. 57d) e explicar qualquer discrepância que houver. i 


ánoa “1080 1931 1932 1933 1084 


1938 1099: 1940 1941 1942 14943 1944 


`. Média 


* mensal | 133,1 130.0 444,1 148,9 145,2 138,0 135,8 105,3 148,8 148,5 153,1 156,0 147,0 139,5 124,0 


1545 1946 1947 1945 1949 1950) 195 


1953 1955 1955 1956 1957 1958 


99,0 117,7 120,7 115,2 H78 117,7 115,5 


443,8 27,5 110,6 1009 17,7 


Fonte: Survey of Current Business 
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59. Resolver os Probls. 57 e 58, para os dados desestacionalizados do 
Probl. 56. As médias mensais dos transportes ferroviários de mercadoria, em 
milhares de vagões, estão apresentadas na tabela seguinte, para os “anos de 1930 
a 1958. G d : 


Tabela 16.41 


Anos 1930 1931 1932 1033 1934 3035 1936 1937 1938 1939 1940 1941 1942 1933 IÐ- 


Média { A 
mensal | 3823 3096 2348 2435 2570 2025 3009 3139 2538 2826 3030 3529 3564 3587 3617 


Anos 1045 1946 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 


O Oaa 


Média E n 
mensal 3493 3445 3709 3560 2093 3242 3375 3105 31857 2826 3136 3154 2058 2517 


Fonte; Survey of Current Business 


60. Ao ajustar os dados às variações de tendência e por estação, haverá, 


alguma diferença, quando um dos ajustamentos fôr realizado em primeiro lugar? . 


Tlustrar a resposta (a) tedricamente, (b) mediante o emprêgo de uma das séries 
temporais dos Probls. 40, 44 ou 48. 


61. (a) Resolver o Probl. 17, usando uma médis móvel centrada de 12 
meses e construir.o gráfico correspondente. ..(b) Que..conclusões - se tirariam doa 
resultados do item (a)? 


62. (a) Obter uma distribuição de frequência das amplitudes das variações 
irregulares verificadas nos Probls. 15 e 16. (ù) A distribuição de fregiiência 
determinada no item (a) aproxima-se de uma distribuição normal ? Se jsso ocorrer, 
apresentar uma razão provável para êsse fato. 


Previsão 


63. (a) Usar qualquer dos resultados dos Probls. 40 a 43, 57 e 58, pura . 


prever a produção das fábricas norte-americanas de manteiga, durante o ano de 
1959. (b) Discutir as possíveis fontes de êrror (c) Comparar as previsões com 
os valores de 1959, apresentados nã Tabela 16.42. 


Tabela 16.42 


Mar. Abr, Mai, Jun. Jul, Agã, Set. Out. Nov. Dez. 


116,3 108,2 121,4. 120,8 143,4 1356 112,5 909 820 921 912 108,0 


Fonte: Survey of Current Business 
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64. (a) Usar qualquer dos resultados dos Probls. 44 a 47 para prever as 
vendas de tôdas as lojas varejistas dos Estados Unidos, durante o ano de 1959. 
w Discutir as possíveis fontes de érro. (c) Comparar as previsões com os valores 
reais de 1959, apresentados na Tabela 16.43. 


Tabela 16.43 


Jan. Fev. Mar Abr. Mai Jun. Jul. Agô, Set. Out. Nov. Dez. 


16,23 14,96 17,19 17,59 18,60 18,71 18,33 18,05 17,57 19,10 17,84 21,45 


Fonte; Survey of Current Business 


65. (a) Usar qualquer dos resultados dos Probls. 48 a 51 e 59, para prever 
o transporte ferroviário de mercadorias nos Estados Unidos, durante o ano de 1959. 
(b) Discutir as possíveis fontes de êrro. (c) Comparar as previsões com os valores 
icais de 1959, apresentados na Tabela 16.44 - 


Tabela 16.44 
EaD NEERA 


Jam. Fev, Mer Abr. Mai Jun. Jul 4gô. Set. Out. Nov. Dez. 


2742 2291 2398 2480 3419 2813 2249 2712 2190 1908 2403 2376 


Fonte: Survey of Current Business 


Problernas Diversos 


: que se referem e dedos norte-americanos. Se desejar, usar apenas os dados dos 
z anos até 1958, prever os resultados para 1959, e compará-lọs com os dados reais 
déste ano. Note-se que os dados dos anos de 1929 a 1958, na primeira parte da 
tabels, referem-se às médias mensais de cada ano, enquanto que os do fim de 
tabela são os valores mensais de cada ano. ' 


66-70. Analisar cada uma das séries temporais apresentadas na Tabela 16.45, 


ESTATÍSTICA 


Tabela 16.45 


: Total de = :-| Produção | Valor de, 
nosadadas | ananass Produção basies º | empreendi- 
) b. em jornais yA de mentos em 
Anos urbanas em 52 madeira 1 e novas 
Q oem o idades (milhões de | Summo | construções 
construção cidades, pés dé (milhares úbli id 
(milhares) | (milhões de | cap -de milhões de” 
linhas) uas) toneladas) (milhões de 
e atje dólares) 
1929 42,4 158,1 3074 
1930 275 1879 2171 Sa pe 
1931 212 1221 1377 740 222 
1932 11,2 97,1 902 437 155 
1953 78 88,8 1225 3,55 137 
1934 10,5 98,2 1291 3,09 184 
1935 184 103,9 1628 497 186 
1986 ' 26,6 115,0 2030 9,37 293 
1937 280 117,5 2166 12,20 258 
1938 33,8 102,1 1804 11,95 285 
1939 42,9 103,6 2096 13,63 317 
1940 50,2 105,7 2411 17,19 302 
1941 58,8 109,4 - 2801 25,76 479 
1942 29,7 108,5 ` 3028 43,43 888 
1943 15,9 116,4 2857 76,68 527 
1944 118 113,4 2745 64,70 256 
1945 174 116,0 2844 41,26 200 
1946 55,9 144,1 2843 34,14 186 
1947 70,8 167,4 2950 47,65 277 
1948 77,6 188,6 3064 51,96 302 
1949 85,4 191,8 2742 50,29 522 - 
1950 116,3 203,3 3242 59,89 572 
1951 90,9 206,5 3126 69,74 771 
1952 93,9 208,8 3122 78,11 808 
1953 92,0 2176 3062 104,33 936 
1954 101,7 215,1 3030 121,71 973 
1955 110,7 237,0 3154 130,48 977 
1956 98,2. 242,6 3219 139,91 1059 
1957 86,8 235,8 2851 137,31 1168 
1958 100,8 228,8 2798 130,46 1284 


EA 


Os dados acima referem-se a médias mensais. 


ANÁLISE DAS SÉRIES TEMPORAIS att 
Tabela 16.45 (cont) 
— T — 
i = Valor de 
Unidades |. Total de Produção Producao empreendi- 
Anos residenciais) oin jornais “de de mentos em 
A urbanas o 52 madeira alumínio novas 
meses Mao cidades (milhões de (milhares construções 
construção | imithões de pés de de públicas 
(milhares) linhas) tábuas) toneladas) (inani de 
1952 
Jan. 64,9 178,1 2694 671 
Fev. 77,1 184,6 2766 636 
Mar. 103,9 213,2 2872 722 
Abr. 106,2 É 3123 829 
Mai. 109,6 225,6 3049 924 
Jun. 103,5 209,8 3214 1002 
Jul. 102,6 175,4 3213 1037 
Agô. 99,1 186,6 3489 1089 
Set. 100,8 214,5 3569 1109 
Out. 101,1 245,0 3596 1071 
Nov. 86,1 234,9 3052 922 
Dez. 71,5 219,8 . 2825 769 
1953 
Jan. 72,1 182,7 2769 89,90 782 
Fev. - 79,2 186,1 2754 92,65 719 
Mar. 105,8 231,7 3091 104,46 798 
Abr. 111,4 232,6. - 3280 102,07 880 
Mai. 108,3 244,4 3071 105,46 953 
Jun, 104,6 216,0 3219 104,15 1034 
Jul. 96,7 188,0 3141 109,29 1089 
Agô. 93,2 198,6 3237 110,55 1097 
Set. 95,1 219,6 3266 109,33 1143 
Out. 90,1 244,4 3326 108,22 1084 
Nov. 81,5 241,3 2893 105,64 933 
Dez. 65,8 224,8 2695 110,29 TIA 
1954 
Jan, 66,4 182,9 2746 116,25 745 
Fev. 75,2 180,7 2906 110,48 730 
* Mar. 95,2 216,2 3361 122,34 792 
Abr. 107,7 233,3 3307 120,43 888 
Mai. 108,5 234,6 3324 125,14 998 
Jun. 116,5 216,6 3124 120,76 1088 
Jul, 116,0 185,8 2724 126,16 1159 
Ago. 114,3 199,4 2956 125,80 1202 
Set. 115,7 218,9 3279 120,33 1205 
Out. 110,7 244,9 3363 125,09 1103 
Nov. 103,6 238,5 3154 121,25 964 
Dez. 9,6 229,5 3085 .. 127,04 "804 


„Os dados acima referem-se à valores mensais. 
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Tabela 16.45 (cont.) 


Unidades | Total de "| produção | Produção nalor A, 
' [residenciais] SPONEIE de básica t 
Anos urbanas | PIONS] madeira de gestig 
e en em 52 (milhões de alumínio nova 
meses | construção cidades és de (milhares cone hrs 
Cniianado | (milhões de | Fkbuas) de > | aieea 
linhas) toneladas, (mil ai 
lares) 
87,6 196,2 2707 128,20 742 
89,9 194,4 2845 116,24 697 
113,8 242,5 3268 130,27 776 
132,0 243,8 3147 126,39 898 
137,6 260,4 3327 131,13, 1030 
134,5 243,7 3491 127,63 1107 
122,7 212,3 2946 132,67 1165 
124,7 219,8 3554 133,55 1216 
1 14,9 246,2 3442 130,61 1208 
105,8 273,1 3334 134,66 1181 
89,2 268,5 3009 133,69 971 
76,2 242,5 2788 140,75 | 783 
Tä 212,2 2991 140,39 741 
78,4 218,3 2993 132,76 700 
98,6 ten 251,3. 8182 145,90 174. 
l Lt 261,0 3245 144,73 932 
1 13,7 268,5 3545 150,80 1099 
107,4 239,3 3437 145,73 1223 
101,1 214,0 3175 151,62 1290 
103,9 227,3 3669 92,41 1349 
93,9 244,1 3263 132,32 1341 
93,6 269,9 3496 149,13 1296 
7 4 262,0 3036 145,08 1066 
63,6 243,1 2597 148,39 901 
1857 
Jan 6,2 210,5 2693 147,03 896 . 
ey: 85,8 207,1 2687 119,06 793 - 
Mar, 87,0 249,5 2914 135,71 885 
tos oo FR 3003 139,15 1055 
Mai. ; ; 3113 1204 
Jun. 99,9 240,6 2952 138,01 1326 
Jul. 97,8 204,0 2793 142,04 1303 
Agô. 100,0 216,4 3194 143,45 1436 
Set. 91,9 241 13 2970 129,28 1473 
Out. 97,0 259,0 3097 133,76 1453 
Nov. 78,2 250,0 2559 135,02 1170 
Dez 63,4 239,6 2239 140,04 È 1023 


Os dados acima referem-se a valores mensais. 
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. Tabela 16.45 (cont.) 
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7 
z Valor de 
Unidades Total d n Produção Piodueag empreendi- 
A residenciais anuncios. de 3 S mentos em 
Amos b: em. Jornals dei e 
urdanas em 52 ma erra alumínio novas | 
hos em idad (milhões de iih construções 
meses | construção (onilhiões d è pés de (mi d E ros públicas 
(milhares) linhas) tábuas) toneladas) (pisa de 
é RO = g 
67,9 197,1 2526 139,91 951 
66,1 188,3 2388 121,98 861 
81,4 227,8 2548 134,02 938 
99,1 228,0 "2676 125,00 1109 
108,5 240,9 2824 126,33 1274 
113,0 226,2 2889 115,33 1422 
112,8 198,0 2810 118,54 1486 
124,0 211,6 3056 125,42 1555 
121,0 224,6 3143 125,94 1604 
115,0 259,2 3272 139,84 1600. 
109,4 252,9 2731 140,96 1403 
91,2 281,0 2716 152,30 1209 
a ado 
87,0 193,5 2650 156,7 1130 
94,5 196,1 2642 142,1 1082 / 
121,0 236,5 2964 157,2 1126 
-342,2 -~-f -255,0 3121.4 155,2 1285 
137,0 263,8 3163 163,9 AABB SS C 
136,7 237,0 3216 167,3 1637 | 
123,8 220,4 3136 179,2 1611 
129,3 234,4 3171 172,8 1608 
120,3 246,9 3324 168,2 1528 
105,5 271,3 3304 173,7 1420 
92,5 259,5 2892 153,7 1119 
83,7 250,9 2947 163,0 1013 
ci d 


Os dados acima referem-se & valores mensais. 


Fonte: Survey of Current Bu 


siness and Department of Commerce 
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Número índice 


“Um número índice é uma medida estatística idealizada para 
mostrar as variações de uma variável, ou de um grupo de variáveis, 
. correlacionadas ao tempo, à localização geográfica, ou a outras carae- 
terísticas como rendimento, profissão etc. Uma coleção de números 
índices de diversos anos, localidades ete., é freqüentemente denomi- 
nada série de indices. 


Aplicações dos números índices 


~ Mediante o emprêgo de números índices pode-se, por exemplo, 
comparar os custos de alimentação ou de vida, cm uma cidade, du~ 
tante um ano; com os de um ano anterior, ou a produção de aço, 
durante um determinado ano, em uma região do país, com a de outra, 
região. Embora sejam usados, principalmente, nos negócios é na 
economia, os números índices podem ser. aplicados a muitos outros 
campos. Na, educação, por exemplo, podem-se usar os números 
índices para comparar a inteligência dos estudantes de diversas loca- 
lidades ou em anos diferentes. l ` 


Muitas repar tições governamentais e particulares estão ocupadas 
„cóm o cáleulo de números índices, ou fndices, como são fregiientemente 
denominados, com as finalidades da previsão dos negócios e das con- 
dições econômicas, proporcionando informações gerais cte. Há, 
portanto, : 


índices de salário, de produção, de desemprêgo e muitos. 
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outros. Talvez o mais bem conhecido seja o indice do custo de vida 
eu do preço para o consumidor, preparado pelo Departamento de Esta- 
tistico do Trabalho. Em muitos contratos de trabalho há certas 
cléusulos de escalonamento que prevêem aumentos automáticos de 
salário correspondentes a acréscimo do índice do custo de vida. 


Neste capítulo, tratar-se-á, principalmente, dos números índices 
«us mostrem as alterações em relação ao tempo, embora os métodos 
«escritos possam ser aplicados a outros casos. 


Pregos relativos 


Um dos exemplos mais simples de número índice é o preço relativo, 
que é a relação entre o preço'de uma única utilidade, em um pertodo 
determinado, e o de outro período, denominado básico ou de referência. 
Para simplificar, admite-se que os preços mantêm-se constantes em 
algum período. Se êles não o são, pode-se tomar uma média ade- 
quada dêsse período, para que essa hipótese seja válida, 


Se po € Pa representam os preços das utilidades durante o período 
básico e O considerado, respectivamente, então, por definição 


Preço relativo = (1) 


o 


e geralmente é expresso em percentagem, mediante a multiplicação 
por 100. 


De maneira mais geral, se Pa € Pp São os preços de uma utilidade 
durante os períodos a e b, respectivamente, o preço relativo do período 
b, referido ao do pertodo a, é definido por PalPa é representado por 
Pas; Dotação que se verificará que é útil. Pór meio dessa notação, 
o preço relativo da Eq. (1) pode ser representado por Poln: 


Exemplo 1. Admite-se que os preços, para o consumidor, de um litro de 
leite, nos anos de 1955 e 1960, são 25e 30 cruzeiros, respectivamente. Tomando-se 
1955 como ano básico e 1960 como o ano dado, tem-se 


preço em 1960 20 12 


= = 120%, 
preço em 1955 25 120% 


Preço relativo = p1955/1960 = 
ou, abreviadamente, 120, com a omissão do simbolo %, como aparece freqilente- 
mente na literatura da estatística. Esse résultado significa simplesmente que 
em 1980, o prego do leite foi de 120% do de 1955, isto é, aumentou de 20%. 
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Exemplo 2. . No exemplo 1, tomando-se 1960 como ano básico e 1955 como o 
ano dado, tem-se 


i 5 
Preço relativo = p9s/1955 = prego em 1956. 26 


preço em 1960 "30 


ou, abreviadamente, 83 + Y%. Isso significa que, em 1955, o preço do leite era 


83 4 % do de 1960, isto é, diminuiu de 162%. 


Note-se que o preço relativo de um certo: período, referido ao 
mesmo período, é sempre 100% ou 100. Em particular, o preço rela- 
tivo correspondente a um período básico é sempre 100. Esse fato 
explica a notação freqientemente usada na literatura da estatística 
e que consiste em escrever, por exemplo, 1955 = 100, para indicar 
que 9 ano 1955 é tomado como período básico. 


Propriedade dos preços relativos 


Se Pas Por Pe, --- representam os preços dos períodos a, b,c, ..., 
respectivamente, existem as seguintes propriedades dos preços rela- 
“tivos associados. A demonstração decorre diretamente das definições. 


l. Propriedade da identidade Pala = 1. 


Ais Ela estabelece, simplesmente, que o preço relativo de um dado 
período, relacionado ao mesmo período, é 1 ou 100%. 77T E 


2. Propriedade da reversibilidade do tempo 


: i 
Pab Poa = À OU Pa = —— 


Poja ` 


Ela estabelece que, se dois períodos são permutados, os preços 


relativos correspondentes são recíprocos. Veja.os exemplos 1 e 2, 
acima, É 


3, Propriedade cíclica ou circular 
Pai Pote Peja = 1, 
Palè Poje Deja Pata = 1 ete. 
4, Propriedade cíclica ou circular modificada. 


Palè Pole = Pote 
Pajo Poje Deja = Paja Cte- 
Decorre diretamente das propriedades 2 e 3, 


| 
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Relativos de quantidade ou volumes relativos 


“ Em vez da comparação dos preços de uma utilidade, pode-se 
estar interessado na de suas quantidades ou de seus volumes, por exem- 
plo a quantidade ou o volume da produção, consumo, exportação 


ete. Nesses casos, fala-se em quantidades ou volumes relativos. Para 


simplificar, como no caso dos preços, admite-se que as quantidades 
são constantes em algum período. Se elas não o são, pode-se tomar 
uma média adequada dêsse período, para que aquela hipótese seja 
válida. 

Se q representa a quantidade ou volume de uma utilidade pro- 
duzida, consumida, exportada etc., durante o período básico, en- 
quanto qn representa a correspondente quantidade produzida, con- 
sumida etc., durante um determinado período, define-se 


: q 
Quantidade ou. volume relativo = Sn, (2) 
Go 


que é geralmente expressa em percentagem, 

Como no caso dos preços relativos, emprega-so a notação Gato = 
= Gula, para representar a quantidade relativa do período b, referida 
ao período à. As mesmas observações e propriedades pertinentes 
"aos preços relativos são “aplicáveis. às quantidades Telativas. 


Valores relativos ' 


Se p é o preço de uma utilidade, durante um período, eg éa 
quantidade ou volume produzido, vendido etc., denig êsse periodo, 
pq é, então, denominado valor total. Em consequência, se 1 009 mo 
de leite são vendidos a Cr$ 30 o litro, o valor total é Cr$ 3 
x 1000 = Cr$ 30000. o 

Se po € qo representam o preço € à quantidade de uma e 
durante um período básico, enquanto Pr © Gn representam SM as 
grandezas, durante um determinado período, os paes to as) 
durante êles, são dados por vo © Um respectivamente, e definidos por 


o = tt Pele (=) e) - 8) 
Valor relativo = a 205 D q 


= preço relativo X quantidade relativa. 
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As mèsmas observações, notações e propriedades pertinentes 
$ s É . . 
aos preços e quantidades relativas podem sér aplicadas aos valores 


» relativos. ; 


Particularmente, se Paj» Jaib € Yap representam o preço, a quan- 


. tidade e os valores relativos do período b, referidos ao período a; 


então, como na Eq. (3): 


Vas ™ Pal Gatos 


que é denominada propriedade da reversibilidade dos jatóres. 


Elos e cadeias relativos 


Sejam Pu Po Po, --- OS preços durante os intervalos. sucessivos 
de tempo 1, 2,3, ... Então, Pim Pay Pay ++. representam os 
preços relativos de cada intervalo de tempo, referidos ao anterior e 
são denominados elos relativos. 


Exemplo 1. Se os preços de uma utilidade durante os anos de 1953, 1954, 
1055, 1956 são 8 12, 15, 18 cruzeiros, respectivamente, os elos relativos são 
prasanssa = 12/8 = 150 (96); piosshoss = 15/12 = 125 (9%): pisssnoso = 18/15 = 
= 120090 


Os preços relativos de um período determinado, referido a qual- . 


quer outro período tomado como básico, pode ser expresso, sempre, 
em-função dos elos relativos. Essa é uma consequência da proprie- 
dade ciclica qu circular dos relativos. Em consequência, por exemplo, 
Pop = Paj Pan Pap 7 


Exemplo 2. De acôrdo com o exemplo 1, o preço relativo de 1956, referente 
an ano básico de 1953, é $ å 


Pisss/956 = Pissaiosa Paosihoss PIOSSAS6S =D TG TG Tg o 225 (%). 


Os preços relativos, referidos a um período básico fixo que, como 


se tem visto, pode ser obtido mediante o emprêgo de elos relativos, 
são denominados, às vêzes, relativos em cadeia referidos a essa base, 


ou relativos cicadeados à base fixa. 


Exemplo .3. Nos exemplos 1 e 2, a coleção dos relativos em cadeia dos anos ` 
1954, 1955 e 1956, referidos ao ano básico de 1953, é dada por 


12 
Pissenosa = 7 = 150(%) 
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x 12 15 A 
Prssa1oso == Pássa/1954 PIO6A/IOSS = Cor Tor T 187,5(%) 
` .12 15 18 
passasse = Pissariasa P1s6a/1955 P1955/1986 = Do "To I5 7 225 (%0) 


As idéias acima são aplicáveis, também, tanto a quantidades 
como a valores relativos. 


Problemas que implicam no cálculo de números índices 


Na, prática atual não interessa muito a comparação de preços, 
quantidades ou valores de, uma utilidade única, mas a de grandes 
grupos delas. Por exemplo; ao calcular um íúdice de custo de vida, 
não se deseja, apenas, comparar os preços do leite em um período, 
em relação ao de outro, mas deseja-se também. comparar os preços 
dos ovos, da carne, do pão, dos aluguéis, das roupas etc., a fim de 
obter-se um quadro geral. Naturalmente, poder-se-ia simplesmente 
relacionar os preços relativos de tódas as comodidades. Isso, entres 
tanto, não seria satisfatório. O que desejaria, seria um único número 
índice que comparasse os preços médios de dois períodos. 


Não é difícil prever que os cálculos dos números índices que 
envolvem grupos de utilidades incluem muitos problemas que 
devem ser resolvidos. Por isso, ao calcular o índice do custo de vida, 
por exemplo, deve-se determinar quais as utilidades que serão in- 
cluídas, bem como ponderar suas importâncias relativas. Podem-se 
coletar dados referentes-aos preços e às quantidades dessas utilidades, 


Enfrentam-se problemas tais como o que fazer quanto ao que 
concerne a diferentes qualidades do mesmo tipo de utilidade, ou quando 
certos utensilios ou materiais são disponíveis durante um certo ano 
.e não O são durante o ano básico. Finalmente, deve-se decidir como 
dispor em conjunto tôdas essas informações e chegar a um único 


número índice de custo de vida, que tenha significado prático. 
O uso das médias 


Pôsto que se pode chegar a um único número índice, que englobe 
uma grande quantidade de informações, é fácil compreender que mé- 
dias, como as consideradas no Capítulo 3, desempenham papel impor- 
tante no cálculo dos números Índices. ` 


J 
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Assim como há diversos métodos para o cálculo das médias, há - 


também vários para .o dos números índices, cada um com suas van- 
tagens e desvantagens. 

A seguir, serão examinados alguns métodos comumente usados 
na prática e que se servem de vários tipos de processos para o cálculo 
das médias. Ainda que inicialmente se fique restrito aos índices de 
preços, ver-se-à como-são facilmente feitas as modificações conveni- 
entes para os índices de quantidade ou de valor. . 


n PRA 
Testes teóricos para os números Índices 


É desejável, do ponto de vista: teórico, que os números índices 
de grupos de utilidades tenham as propriedades satisfeitas pelos rela- 
tivos (isto 6, as dos números índices de uma, utilidade única). Diz-se 
de qualquer número índice que goze de uma certa propriedade, que 
êle satisfaz ao teste associado a essa propriedade, Dessa forma, por 
exemplo, diz-se que os números índices que apresentam a proprie- 
dade da reversibilidade do tempo satisfazem ao teste da reversibilidade 
do tempo ete, 

Nenhum número índice já descoberto satisfaz a todos os testes, 
embora em alguns casos êles sejam aproximadamente satisfeitos. O 
índice ideal de Fisher (pág. 523), que satisfaz, particularmente, ao 


“ieste dü reversibilidade do tempo e à da reversibilidade dos jatóres,” 


satisfaz, mais aproximadamente do que qualquer outro índice numé- 
rico conveniente, as propriedades consideradas importantes, donde” 
seu nome de ideal. 

Do ponto de vista prático, entretanto, outros números índices 
também são úteis e alguns déles serão examinados. 


Notação 


Costuma-se representar por pa, pa, Pr, ..., os preços de 
uma primeira, segunda, terceira, ..., utilidade durante um certo 
período n. Os preços correspondentes, durante um período básico, 
são representados por p,®, p,/2, pi) etc. Os números 1, 2, 3, 
são sobrescritos é não devem ser confundidos com os expoentes. Por 
meio dessa notação, o preço de uma utilidade j, durante o período n, 
pode, então, ser indicado por p”. 


Como nos capítulos anteriores, pode-se usar a notação para 
somatório, mediante a adição com o índice j. Por exemplo, admi- 
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o 
Ro 
pa 


tindo-se que há um total de N utilidades, a soma de seus’ preços 


durante o período n, poderia ser indicada poř X pd, ou E pd. 
j=l 


É mais simples, contudo, omitir inteiramente o sobrescrito e escrever 
Lp, o que será feito quando disso não possa resultar nenhuma 
confusão. 

“Deve-se, entretanto, ter em mente que fica subentendido o sim- 
bolismo mais completo. Por meio dessa notação, bp, representaria 
a soma dos preços de tôdas as utilidades, durante o período básico. 


Usa-se uma notação semelhante para as quantidades e os valores. 


Método agregativo simples 


Neste método de cálculo de um índice de preço, expressa-se O 
total dos preços das utilidades, em um dado ano, em percentagem 
do total dos preços das utilidades no ano base. Em símbolos, tem-se: 


Índico de preço agregativo simples = 52 5 (4) 
o 


em que È p, = soma de todos os preços das utilidades, no ano básico, 
E p, = soma dos preços das utilidades correspondentes, no ano dado, 
e cujo resultado é expresso em percentagem, como- „todos os-núme-.... 


ros índices em geral. 

Embora éste método tenha a vantangem de ser fácil de aplicar, 
apresenta duas grandes desvantagens, que O tornam pouco satisfa- 
tório. 

1. Não se toma em consideração a importância relativa das 
várias utilidades. Portanto, de acôrdo com êste método, 9 mesmo 
pêso, ou importância, seria atribuído ao leite e ao creme de barbear, 
no cálculo do índice do custo de vida, 

2. As unidades particulares, adotadas para a fixação dos preços, . 
como litros, metros cúbicos, quilos ete., afetam o valor do índice. 
Veja o Probl. 12. 


Método das médias simples dos relativos 


Neste método há várias possibilidades, dependentes do processo 
. adotado para a-determinação da média dos preços relativos, como à 
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média aritmética, a geométrica, a harmônica, a mediana ete. Ado- 
tando-se a média aritmética, por exemplo, ter-seia.: 
n Média «aritinética simples dos índices dos pregos relativos = 


— 2 Palpe + Rae 
TON. ; (5) 


em que Z Pulp; = soma de todos os preços relativos das utilidades, - 


N = número empregado dos preços relativos das utilidades. 
Para os índices que se utilizam de outros tipos de média, veja 
os Probls. I4'e 15. 


Embora êste método não apresente a segunda desvantagem do 
método agregado simples, oferece: ainda a primeira. 


Método agregativo ponderado 


Para superar as, desvantagens do método agregativo simples, 
pondera-se o preço de cada utilidade, mediante um fator conveniente, 
que é, frequentemente, a quantidade ou o volume da utilidade adqui- 
rida durante o ano-básico, o. considerado, ou qualquer ano típico 

(que pode consistir em uma média de vários anos). fsses pesos 
“indicam a importância de cada utilidade particular. Há três fór- 
mulas possíveis, conforme se empregarem as quantidades do ano 


básico, de um determinado, ou de um ano típico, representadas por 


Qas Im € qu respectivamente. 


1. Índice de Laspeyres ou método do amo base 


Índice de preço agregativo ponderado em relação às quantidades 


Z Parto 


do ano básico = 
È Pe Qo 


(6) 


e Paasche ou método do ano determinado 


É 2.. Indicé 


Índice migo agregativo ponderado em relação às quantidades 


i de um determinado ano = qt (7) 
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3. Método do ano típico 
Se 4 representa o pêso correspondente da quantidade, durante 
algum período típico é, define-se então: 


Índice de preço agregativo ponderado em relação às quanti- 


as ico = Pa 8 
dades do ano típico = o ). 


Para t = 0 e t = n, essa expressão torna-se equivalente às (6) 
e (7), respectivamente. 


Índice ideal de Fisher 

É definido por: 

Índico de preço ideal de Fisher = 

a (52%) mat) “9 
Z polo )NZPoM 

Este idic é a média geométrica dos números índices de Las- 
peyres e Paasche, dados pelas Eqs. (6) e (7). Como se observou ante- 
riormente, o índice ideal de Fisher satisfaz tanto ao teste da reversi- 


bilidade do tempo" como ao da reversibilidade dos fatôres, o que lhe 
confere certa vantagem teórica sôbre os outros números índices. 


O índice de Marshall-Edgeworth 


O índice de Marshall-Edgeworth emprega o método agregativo 
ponderado do ano típico, sendo o pêso a média aritmética das quanti- 
dades do ano básico e da determinado, isto é, q: = + (go + qu. Le- 
vando êsse valor de q; na Eq. (8), tem-se: 

Índice de preço de Marshall-Edgeworth = 


— E Pu (Go + qm) ao) 
E polo + Qu) 


Métodô da média ponderada de relativos 


Para superar as desvantagens do método da média simples de 


` ralativos, pode-se empregar uma média ponderada de relativos. À 


média, poúiderada mais frequentemente usada para êsse fim é a arimé- 


t 
tj 
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tica, embora possam também ser empregadas outras, como a geomé- 
trica (Capítulo 3). i 

Neste método; pondera-se cada preço relativo, tomandó-se para 
pêso o valor total da utilidade, expresso em alguma unidade mone- 


táriá, como o cruzeiro. Como o valor da utilidade é obtido pela. 


multiplicação do seu. preço, p, por sua quantidade, q, os pesos são 
dados por pq. 

Há três fórmulas possíveis, conforme forem adotados os valores 
do ano básico, do dado ou do-típico, representados por Pa Go, Pa Qn è 
Pi qu respectivamente. 


Média aritmética ponderada dos preços relativos, usando os 


valores do ano. base como pesos = 


E (PaPe) (Pego) _ E Pal ; 
= Coin Po) NOJO, qu mami dO + 11) 
È Po ho È Podo | ( 


Média aritmética ponderada dos preços relativos, usando os 


E (papo) (Pat) (2) 


valores do ano dado como pesos = 
a È Pn fin 


Média aritmética ponderada dos preços relativos, usando os. 


Z (palpo) (Pigi) a3) 


valores do ano típico como pesos = É pa 
tt 


Note-se que a expressão (11) conduz ao mesmo resultado que a 
fórmula de Laspeyres dada em (6). 


Números índices de quantidade ou de volume 


As fórmulas acima descritas, para a obtenção de um número 
índice de preços, podem ser facilmente modificadas para a obtenção 
de números índices de quantidade ou de volume, pela simples permu- 
tação entre pe q. Por exemplo, uma substituição de p em q na ex- 
pressão (5) dá: 

Média aritmética simples dos índices de volume relativos, = 

È 

Zelte, (4) 
em que Eq./qo = soma de tôdas as quantidades relativas das utii- 
dades, N =número empregado de quantidades relativas das utilidades. 


sa 
p 
i 
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De modo semelhante, as fórmulas (6) e (7) tornam-se: 
“ Índice agregativo ponderado de volume, usando os preços do 


Lao Ia Po a 5. 


ano base como pesos = . 
È go Po 


Este é às vêzes denominado índice de volume de Laspeyres. 
Índice .agregativo ponderado de volume, usando os preços ¿e 


Z gn Pa so 
ano dado como peso: = Eq Pa no (18) 


fiste é às vêzes denominado indice de volume de Paasche. 


Nessas fórmulas, usam-se os preços como pesos. Entrotanto, : 
pode-se usar, em vez dêles, quaisquer outros pesos convenientes. 


De modo semelhante, podem ser modificadas as fórmulas (8) a (13). 


Números índices de valores 


Assim como foram obtidas fórmulas para índices de preço e 


volume; também podem :ser conseguidas. fórmulas. para indices, de.. 


valores. O mais simples dêsses índices é 
RR z 
índice de valor = p=, (17) 


em que È p, G= valor total de tôdas'as utilidades no período básico, 
E pa Qu = valor total de tôdas as utilidades no período dado, 


Esse é um Índice agregativo simples, porque os valores não são 
ponderados. Podem ser estabelecidas outras fórmulas, nas quais 
os pésos indiquem a importância. relativa dos itens. 


Mudança do período básico dos números índices 


Na prática, é desejável que o período básico escolhido, pata fins 
de comparação, seja de estabilidade econômica e não esteja n 
distante no passado. . De tempos em tempos, entretanto, pode 
necessário mudar o período básico. 
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Uma possibilidade consiste em recalcular todos os números 
índices, mediante a utilização do nôvo període básico. O método 
aproximado mais simples consiste em dividir todós os números índices 
dos vários anos, correspondentes ao período base antigo, pelo número 
fndice correspondente à nova base, exprimindo-se os resultados em 
percentagem: Esses resultados representam os novos números ín- 
dices, sendo o do nôvo período básico 100(%), como deveria ser. 


Matematicamente falando, êsse método sômente é estritamente 
aplicável quando os números índices satisfazem o teste circular (veja 
o Probl. 37). Entretanto, para vários tipos de números índices, o 
método, afortunadamente, produz resultados que, na prática, estão 
bastante próximos dos que seriam obtidos teoricamente. 


Deflação, das séries temporais 


Embora os salários individuais possam, tedricamente, estar ascen- 
dendo através de um período de anos, os salários reais podem, real 
mente, estar declinando, devido, ao aumento do custo de vida e, 
em conseqüéncia, diminuindo de poder aquisitivo. stes salários 
reais podem ser obtidos mediante a divisão dos salários aparentes ou 
físicos dos vários anos pelos númêros índices do custo de vida ou 
dos preços para o consumidor dêsses anos, adotado um período básico 
adequado. 


Por exemplo, se o salário de um indivíduo, em 1960, é 
150% do de 1950 (isto é, aumentou de 50%), enquanto o índice de, 
custo de yida dobrou, durante o mesmo período, o salário real do 
indivíduo, em 1960, é apenas 150/2 = 75% do que era em 1950. 


Descreveu-se acima o processo de dejlacionar uma série temporal 
que envolve salários. Processo semelhante pode ser usado para 
deflacionar outras séries temporais. No Capítulo 16, por exemplo, 
usou-se um processo análogo para desestacionalizar dados, mediante 


o emprêgo de números índices por estação. 


Matematicamente falando, êsse método de deflação das séries 
temporais sómente é estritamente aplicável quando o número índice 
satisfaz o teste de reversibilidade dos fatóres e, por essa razão, o índice 
ideal de Fisher é adequado. Entretanto, outros números índices 
podem ser usados porque produzem resultados corretos, para a maioria 
dos fins práticos. 
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Problemas Resolvidos 


Preços relativos 


1. Os preços médios, no varejo, em dólar por tonelada (de 2000 
libras), de carvão betuminoso vendido nos Estados Unidos, durante os 
anos de 1953 a 1958, estão apresentados na Tabela 17.1. (a) Adotado 
o ano de 1952 como básico, determinar os preços relativos correspon- 
dentes aos anos de 1956 e 1958. (b) Adotado o ano de 1956 como 
básico, determinar os preços relativos correspondentes a todos os 
anos dados. (c) Adotado o período de 1953 a 1955 como básico 
determinar os preços relativos. correspondentes a todos os anos dados. 


1956 | 1957 | 1958 


16,28 | 16,58 


Tabela 17.1 


Anos 


Preço médio de carvão 
betuminoso, a varejo 
(dólar por tonelada) 


14,95 


Solução: 
(a) Preço relativo de 1956, adotado o ano de 1953 como básico == 


preço em 1956 ss 15,65 ce 1,047 = 104,7% 


= pigss/1956 = “preço em. 1953 14,95 


Preço relativo de 1958, adotado o ano de 1953 como básico = 


preço em 1958 16,53 


= Prosajtoss = = 4,95 


reço em 1953 = 1,106 = 110,6 %. 
p 3 


Na literatura estatística, é costume omitir o simbolo % quando são citados 
os números índices, embora. êle esteja subentendido. Por meio dessa convenção, 


` og preços relativos acima são citados como 104,7 e 110, 6, respectivamente. 


(b) Divide-se cada preço, no varejo, da Tabela 17.1, por 15,65 dólares, cor- 


respondente ao ano de 1956. Então, os preços relativos desejados, expressos 
em percentagem, são os indicados na Tabela 17.2. 


Tabela 17.2 
Anos 1953 | 1954 | 1955 | 1956 | 1957 | 1958 
Preço relativo 55 | 965 | 100,0 | 1040 | 1056 
(1956 = 100) 95,5 | 95, ad 
l 


a luta $ 
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. Elea representam os números indices dos preços no varejo para o carvão betu- 
wénoso, € respondent aos anos de 1953 a 1058, sendo tôda a coleção denominada 
mdices. Note-ss que o preço relativo (ou número índice de preço) tones. 
inte no ano de 1956 é, em percentagem, iguala 100, o què sempre paços 

em um período básico. Isso é fregiientemente descrito simbôlicamento, li; 
ratura estatistica, como 1556 = 100. ' did 


(co) Média aritmética dos preços dos anos de 1953 a 1955 = 


Divide D nO VAN 


“bico: o, du Tabela 17.1, por êsse preço médio do perso- 


i 5,04 0, os preços relativos desejados, expressos em percenta- 
gem, são os indicados na Tabela 17.8, 


Tabela 17.3 


Ea 
1953 | 1954 | 1955 


Preço relativo a 
(1953-1955 = 100) 99,7 99,6 100,7 


ss Ejes representamos números índices dos preços, no varejo, -do carvão betu- 
minoso, durante os enos de 1953 a 1958, adotado o período de 1953 a 1955 como 
hánico.... Note-se. quo a média aritmética dos números índices correspondentes 
20 periodo básico de 1953 à 1055 é (99,7 + 99,6 + 100,7)/3 = 100, o o si z i 
ocorre em um período básico. Isso é frqüentemente deserito, abolic menh 
na literatura ostaifstica, como 1953-1955 = 100. i , ab 


2. Provar que (a) Pop Poe = Pats (È) Po Pij = À. 
Solução: 


(a) Por definição, pao Poje = Pe 


(b) Por definição, Pai Poje - 

po 

` ki ms a Tabela 17:3 do Probl. 1(c), com o período de 
1953 a 1955 como básico, obter os 3 relati i 

. s preços relativos referentes a 

de 1956 como básico. pa RENA 


Solução: 


Divide-se cada preço relativo dz Tabela 17.3 pelo de 104,3, correspondente 


a 1956. Os nú e 3 i r 
1956. Os números resultant xpressos em percentagem, são os preços relati- 


vos desejados e estão apresentados, desprezados os erros de arredondamento, 
e es sentados, desprezados o 
o: d dond: to 
na Tabela 17.2 do Probl. 15) 


“isto 6, 0 preço, relativo em 1957 é 2 
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Éste exemplo mostra que, dada uma série de índices, correspondentes a um 
períódo básico, pode-se obter a série correspondente a outro período básico sem 
usar 08 dados referentes aos preços originais. O processo adotado é conhecido 
como mudança do pertodo básico ou deslocamento da base. 

Para uma demonstração da validade do método usado neste caso, veja O 
Probl. 36. À 

4. Em 1956, o preço médio de uma utilidade era 20% superior 
ao de 1955, 20% inferior 80 de 1954 e 50% superior ao de: 1957. 
Reduzir os dados & preços relativos, adotando como base os anos 
Lo) 1955, (b) 1956 e (c) de 1954 à 1955. 


Solução: 

(a): Tomando-se o ano de 1955 como básico, O preço relativo (ou número 
indice) que lhe corresponde é 100. (Simbôlicamente, 1955 = 100 ou 100%.) 

Como o preço, em 1956, é 20% superior ao de 1955, 0 preço relativo corres- 
pondente a 1956 é 100 + 20 = 120, isto é, o prego em 1956 é 120% do preço em 
1955. 

Como o preço em 1956 é 20% inferior ao de 1954, êle deve ser.100 — 20 = 
= 80% do preço em 1954. Então, o prego em 1954 é 1/0,80 = 5/4 = 125% do 
preço em 1956, isto é, o preço relativo em 1954 é 125% «do de 1956, isto é, 125% 
de 120 = 150. : ` 

Como o preço em 1956 é 50% superior ao de 1957, êle deve ser 100 + 50 = 
= 150 do de 1957. Então, o preço em 1957 é 1/1,50 = 2/3 do preço de 1956; 
/3 do de 1956, isto é, 2/3 de 120 = 80. Por 


conseguinte, Os preços relativos deseja: 


Tabela 17.4 
Anos rosa | a955 | 1956 | 1957 
RE 
e or 150 | 100 | 120 | 80 
enk- 


tb) Usa-se o método da mudança do período básico, estabelecido no 
Probi. 3. Divide-se ceda preço relativo da Tabela 17.4-por 120 (preço relativo 
correspondente 20 nôvo ano básico 1956) e exprime-se o resultado em percenta- 
gem. Então, os preços relativos, referidos so ano básico de 1956, são 08 apresen- 
tados na Tabela 17.5. 


Tabela 17.5 
Anos 1954 | 1955 | 1956 1957 
i 
Preço relativo E» À é 
Céso = 100) 25 | esa | 100 | 667 
Ra 


dos são os apresentados nã Tabela 17.4 == 
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Pode-se também proceder diretamente, por mejo.. de raciocínio, como nc item 
(a), fazendo-se” 1956 =.100. 
(6; Primeiro método, utilizendo o item (8). 


De acôrdo” com a Tubela 17.4, a média aritmética dos preços relativos, em 
1954 e 1955, € 3(150 + 100) = 125. Então, “dividindo-se cada preço relativo 
da Tabela 174 por 125, obtém-se os preços relativos desejados, que estão 
apresentados na Tabela 17.6 

ss | 1957 


Tabela 17.6 


i Anos | 1954 


Preço relativo 120 
(1954 — 1955 = 100) 


1955 


Segundo método, utilizando o item (b). 

De acôrdo com a Tabela 17.5, a média aritmética dos preços relativos, era 
1954 e 1955, é (125 + 83,3) = 104,2. Então, dividindo-se cada preço relativo 
da Tabela 17.5 por 104,2, obtém-se resultados iguais gos do primeiro método. 


Quantidade ou volume relativos 


5. Na Tabela 17.7 estão indicados os dados sôbre a produção de 
trigo, emmilhões de bushels, nos Estados Unidos,-nos-anos: de 1950 
a 1958. Reduzir os dados a quantidades relativas, adotados como 
básicos (a) 'o ano de 1955 e (b) o período de 1950 a 1953. 


Tabela 17.7 


Anos 1950 | 1951 | 1952 | 1953 | 1954 


1955 | 1938 | 1957 | 1958 


Produção de érigo 
(milhões de bushela) 1019] 988 | 1308| 1173) 984 935 1004) 951 1462 


Fonte: Department of Agriculture 
Solução: 


(a) Dividindo-se a produção de cada ano por 935 (produção do ano básico, 
1955), as quântidades relativas desejadas (ou os números índices de quantidade) 
expiessis em pércêntagem, para os vários anos, são a8 apresentadas da Tabela 17.8. 


Tabela 17.8 


1950 | 1951 | 1952 1953 | 1954 | 1955 | 1956 


108,0 | 1067 139,7 | 125,5 | 105,2 
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(b). Média aritmética da -produção nos anos de 1950 a 1953 = &a 019 + 


-+983 -+1306 + 1 173) = 1 122. Dividindo-se a produção de cada ano por 1 122, 


as quantidades relativas desejadas, expressas em percentagens, são as apresentadas 


l 9. 
pa Tabeli dt; Tabela 17.9 


1950 | 1951 | 1652 | 1953 | 1954 | 1955 | 1956 | 1957 | 1958 


Anos 


(1950-1953 = 100) 


. Quantidade relativa ps 88,1 | 116,4 | 104,5 | 87,7 | 83,3 | 89,5 | 848 | 130,3 
i 


6. A quantidade relativa no ano de 1958, referida ao de 1949 
como básico, é 105, enquanto que a de 1958, referida ao ano de 1953 
como básico, é 140. Determinar a quantidade relativa de 1953, ad- 
mitido o ano de 1949 como básico. 

Solução: 

Primeiro método: 
De scôrdo com as propriedades das quantidades relativas tem-se: 
Qalb Golo = Gales 
Sejam a = 1949; b'= 1953 e c = 1958. Então: 
qissohosa = quosspross Quossnosa = (L,05)(1/1,40) = 0,75 = 75%, 
e a quantidade relativa desejada é 75. 

Segundo método: 

Sejam g1ı949, g1953 € Q1958 88 quantidades reais dos anos de 1949, 1953 e 1058, 
respectivamente. 

Então: 

Quantidade relativa de 1958, com 1949 como ano básico = 


= SOS... 105% = 1,05. 
q:949 


Quantidade relativa de 1958, com 1953 como ano básico = 


= SSB. 140%, = 1,40. 
g1953 


Então, as quantidades relativas de 1953, com 1949 como ano básico, é 


gsis quoasigiass — 1/1,05 1,40 


gosa  Qussígross _ 1/140 1,05 15% 


Terceiro método: 
> q1953 1,05 


= == 75%. 
quoas 1,40 % 


Como giosa = 1,05g3949 = 1,40gr9s3, então 


Portanto. a quantidade relativa desejada é 75: 


ATÍSTICA 


Valores relativos 


7. Em janeiro de 1960, uma fábrica pagou um, total de 
Crg 4000 000 a 120 empregados incluídos na fôlha de pagamento. 
Em julho do mesmo ano, a fábrica tinha mais 30 empregados e pagou 
mais Cr$ 600000 do que em janeiro: Adotado janeiro de 1960 
como base, determinar (a) o número índice de emprêgo (quantidade 
rélativa) em julho; (b) o número índice da despesa com a mão-de- 
-obra (valor relativo) em julho. (c) De acôrdo com “o resultado da 
expressão “Prego relativo” X “Quantidade relativa” = “Valor re- 
lativo”, que interpretação pode ser dada ao preço relativo, neste 


caso? 


Solução: 
(a) Número índice de emprêgo = Quantidade relativa = 
DO +30 os = 1259 5 
120 1,25 = 125% ou 125. 


(b) Número índice da despesa com a mão-de-obra = valor relativo =" 


Cr$ 4.000 000 -+ Cr3 600 000 


EAR E = = 1159 : 
— Cr$4000000 1,15 = 115% ou T15.. 


Pre lati TAP em = o us 0,92 = 92% as 

(e). Progo: relativo quantidade relativa = 125º 0,92 = 92% ou 92. 
Pode-se interpretar êsse resultado: como número índice de custo por empregado. 

-Bignificado que, em julho de 1960; o custo por empregado era 92% do período 

básico, janeiro de 1960. Ésse valor é, às vêzes, denominado número índice do custo 

de trabalho per capita. 


8. Uma companhia espera que suas vendas de uma, utilidade 
aumentem de 50% no próximo ano. De que percentagem deveria 
ser aumentado o preço de venda, para que a venda bruta duplique? 


Solução: 


Preço relativo X quantidade relativa = yalor relativo 


Prego relativo X 150% = 200% . 
Então, preço relativo = 200/150 = 43 = 133%, de modo que os preços: 


de venda deveriam ser aumentados de: 1334 — 100 = 385%. 
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Elo e cadeia relativos 


“9. Os elos relativos dos preços no período de 1956 a 1960 são 
125, 120, 135, 150 e 175, respectivamente. (a) Determinar o preço 
relativo de 1957, com o ano de 1955 como básico. (b) Encadear 
os elos relativos, com o ano de 1956 como básico. 


Solução: 


poss/iose = 1,25, Piosenosy = 1,20, pissyiosa = 1,35, 


prossriaso = 1,50, piosonoso = 1,78 


(a) Prossnos7 = Pioss/1956 P1956/1967 = (1,25X 4,20) = 1,50 = 150% 


1 1 
— = o = 80 
Prost/1956 1,25 % 
piose/1956 = 100% Prssanosr = 120% 
201,85) = 1,82 = 162% 


o =(1,20X(1,35) (1,50) =2,43 =243 %o 


(b) prssenoos = 


prosajiose = Pigss/s7 prostaoss = (1 
Pa956/1959 == Pi956/1957 P1957/1958 P1958/1951 
P1956/1960 = P1950/1967 P1957/1958 P1958/1959 p1959/1960 = 
= (14,20) (1,35) (1,50) (1,75) = 425% 


| Números índices. Método agregativo simples 


10. A Tabela 17.10 apresenta os preços médios por atacado, nos 


Estados Unidos, e a produção de leite, manteiga e queijo, nos anos de 


1949, 1950 e 1958. Calcular um índice agregativo simples dos preços 
por atacado dêsses produtos de laticínio para o ano de 1958, tomando 
como básicos os anos (a) 1949: e (b) de 1949 a 1950. 


Tabela 17.10 


Quantidades produzidas 
Preços (cents por libra) (milhões de libras) 


1959 | 1958 


1949 1950 | 1958 1949 


F 
| 
RES E 
Leite 3,95 3,89 4,13 9675 | 9717 10436 
Manteiga 61,5 62,2 59,7 117,7 115,5 115,5 
Queijo 34,8. 35,4 38,9 77,93 74,39 82,79 


Fonte: Survey of Current Busimess 


asd ESTATISTICA 


Solução: 


(a) Índice agregativo simples dos preços ou = 


soma, dos preços do ano dado (1958) 4,13 + 59,7 + 88,9 


soma dos preços do ano básico (1949) 3,95 + 61,5 + 34,8 F. 
102;5(%), isto é, os preços médios por atacado, em 1958, são 
102,5% dos de 1949 (ou 2,5% maiores). 


Li 


W) Prego: médio (média aritmética) do leite no período básico de 1949 a 
1950 = (3,95 + 3,89) = 3,92 cenis por libra. 

Preço médio (média aritmética) da manteiga no período básico de 1949 a 
1950 = (61,5 + 62,2) = 61,85 cents por libra. i 

Preço médio (média aritmética) do queijo no período básico de 1949 a 1950 = 
= 434,8 + 35,4) = 35,1 cents por libra. 
E pn 
È po 
soma dos preços do ano dado (1958) 
somados preços do período básico (1949 a 1950) 


ABA 89,7 + 38,9 
= 3,92 + 01,85 + 35,1 7 10,8% 


Índice agregativo simples de preço = 


Note-se que êste método não faz uso das quantidades produzidas mas, sômente, 
dos preços das utilidades. 

Para as finalidades da exemplificação, utilizaram-se apenas 3 utilidades para 
o cálculo de um número índice. Realmente, na prática, muitas outras utili- 
dades seriam incluídas. 


11. Explicar por que os números índices obtidos no Probl. 10 
podem ser inadequados para medir as alterações de preços de uma 
dada utilidade. 


Solução: 


O índice calculado no Probl. 10 não leva em consideração a importância re- 
lativa des utilidades, que seria determinada; por exemplo, pela indicação de 
quanto é usado pelo consumidor, ou quanto é produzido para os fins de “Sonsumo. 
Essas considerações serão feitas em problemas subseqiientes. 


2. A “Tabela 17.11 mostra os preços médios, no varejo, e a pro- 
dução; de carvão de pedra e gasolina, nos Estados. Unidos, durante 
os anos de 1949 e 1950, Explicar por que um índice agregativo sim- 
ples de pregas, Para 1958, com o ano de 1949 como básico, é uma me- 
dida inadequada das alterações dos preços dessas utilidades. 
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Tabela 17.11 


Preços Quantidades 
5 Hi 

f ui 

1949 1958 1949 1958 

— sp E] 

. s20,13 s28,20 3,559 1,821 
Carvão de pedra o, tonelada. | por tonelada milhões de milhões de 
toneladas toneladas 

20,3 centa 21,4 cents 80,2 118,6 
Gasolina por galão por galão milhões de milhões de 
barris * barris + 
Fonie: Survey of Current Business 4 Cada barril contém 42 galões 

Solução: 


Se fôr adotado um fudice de preço agregativo simples, o resultado será: 


Dpr „oma dos. preços do ano dado (1958). $28,20 -+ 80,214. 
Epo soma dos preços do ano básico (949) 820,13 + 30,203 


="189,7%, 


o que indica que os preços médios, no varejo, dessas utilidades, em 1958, eram 
39,7% superiores aos de 1949. 

Exprimindo-se os preços: do carvão de pedra em cenis por libra, em ve? de 
dólar por tonelada (de 2000 libras), o preço, em 1949, é $20,13/2 000 Ib = 10,1 : cats 
por libra, enquênto que, em 1958, é 828,20/2 000 1b = 14,1 cents,por libra. Neste 
caso, o índice -gregativo simples de preço é ` 


5 Em _ 141 +214 
Epo’ 10,1 + 20,3 


= 116,8 (%), 


o que indica que os preçòs médios, no varejo, dessas utilidades, em 1958, eram 
16,8% superiores aos de 1949. i 


Como o índice agregativo simples é tão sensível às unidades ádotadas para 
a fixação do prego êle é, evidentemente, uma medida inadequada a êsses casos. 
Essa desvantagem, conjugada à expressa no Probl, 11, proporciona boas razões 
para que êsse índice não seja adotado na prática, 


A observação feita no final do Probl, 10 também se aplica a êste problems. 


Método das médias simples de relativos 


13. Usar o método das médias simples de relativos (média 


aritmética) para o cálculo do índice de preços, por atacado, dos pro- 


dutos de laticínio do Probl. 10, para o ano de 1958, adotados como 
anos básicos (a) 1949 e (b) de 1949-a 1950. 


536 ESTATÍSTICA 


Solução: 
(a) Os preços relativos do leite, manteiga e queijo em 1958, com o ano de 


1949 como bésipo; são os seguintes: . 


E 1. preço do leite em 1968 413 104,6(%); 
Preço relativo do leite = prego do leite em 1949 3,95 (Go); 


prego da manteiga em 1958 597 _ 


preço da mahteiga em 1949 61,5 
“= 97,1%); 


Preço relativo da manteiga = 


“prego do queijo em 1958 38,9 ' 
preço do queijo em 1949 34,8 


Preço relativo do queijo = 
= 111,8(%). 
Média (aritmética) dos preços relativos = 


= Zur m JOS AOL ELS 104,5(%) 


(b) Com referência ao Probl, 10(%), os preços relativos de 1958, com. o pe- 
ríodo de 1949 a 1950 como básico, são: 
Prego relativo do leite = 


= preço do leite em. 1958 = 413 4 105,4(%); 
preço do leite no período de 1949 a 1950. 3,92 


“Preço relativo da manteiga = 


E preço da manteiga em 1958 ` 59T 96,51%): 
preço da manteiga no período de 1949 a 1950 61,85 


Preço relativo do queijo = 


k 


e preço do queijo em 1958 38,9 = 110,8(%). 
preço do queijo no período de 1940 a 1950 35,1 


Média (aritmética) dos preços relativos = 


Enio _ 1054 +90,5 +1108. L 104, 2(%). 


N 3 


14. Resolver o Probl, 13, quando fôr usada a mediana em vez 
da média aritmética. 


Solução: 

(a) Número fndice desejado = medisns dos preços relativos 104,0, 97,1 e 
111,8 = 104,6. . 

(b) Número índice desejado = mediana dos pregos relativos 105,4, 96,5 e 
110,8 = 105,4. 


gap IT ; ; Números ÍNDICES ` 


so ~ — preço -då -gasoliná-em- 1949. 7. /20,3-cents 


ex 
E 
< 


15. Resolver o Probl. 13 quando fôr usada a média geomé- 
trica em lugar da aritmética. 


Solução: . 


(a) Número índice desejado = média geométrica dos preços relativos 
104,6, 97,1 e 111,8 = (104,6) (87,1) 011,8} = 104,3, mediante o emprêgo de 
logaritmos. 

(b) Número indice desejado = média geométrica dos preços relativos 105,4, 
58,5 e 110,8 = "/(105,4) (96,5) (110,8) = 104,1 mediante o emprêgo de logaritmos. 

16. Usar a média simples dos preços relativos (média aritmética) 
para a obtenção de um número índice dos preços, no varejo, das 
utilidades do Probl. 12, adotado como básico o ano de 1949 e 1958 
como o dado. 


Solução: 
Preço relativo do carvão = 


— Preço do carvão em 1958 = 828,20 E 
preço do carvão em 1949 = 320,1 8 = 10,10%). 


„Preço relativo da gasolina = 


a preço da gasolina em 1958 - Sé cents 


= 10A 


Médie simples dos preços relativos (média aritmética) = 


By 5 
— Èpalpo _ 140,1 +1054 y» 
= o e e mm 120,8. 


Note-se que o resultado € independente das unidades adotadas para o esta- 
belecimento dos preços comparar com o Probl. 12). 


17. Resolver o Probl. 16, quando fôr usada a médis geomé- 
trica. 


Solução: 


Número índice desejado = média geométrica dos preços relativos 140,1 e 


105,4 = v(140,1) (105,4) = 121,5 


Método agregativo ponderado. Índices de Laspeyres e Paasche 


18. Usando os dados do Probl. 10, calcular um número fn- 
dice de Laspeyres dos preços para o ano dè 1958, adotados como 
básicos (a) o ano de 1949 e (b) o período de 1949 a 1950. 


588. “E ESTATÍSTICA 


Solução: 


Cota “Índice: de Laspeyres = índice agregativo pondêrado dos preços, com &s 
E Pango 


quantidades: do período básico como pesos = 
e E po qo 


e (preços em 1958) (quantidades êm 1949) _ 
E (próços em 1949) (quantidades em 1949) 


(4,13) (9 675) + (59,7) (117,7) + (38,9) (77,93) 
(3,95) (9 675) + (61,5) (117,7) + (34,8) (77,98) 


= 103,84 ou 103,4%). 


(b) As quantidades médias de leite, manteiga e queijo, produzidas no período 
de 1949 a 1950, são (9675 + 9717) = 9606; }(117,7 + 115,6) = 116,6 e 
&(77,93 + 74,89) = 76,16, respectivamente. Os preços médios no período de 1949 
a 1950 estão indicados mo Probl. 10. 


È pn lo a 
E po Go 


Índice de Laspeyres = 


á E (preços em 1958) (quantidades médias no período 1949-50) 
E (pregos em 1949-50) (quantidades médias no período 1949-50) ii 


=s 


(4,13) (9 696) + (59,7) (116,6) + (38,9) (76,18) 


(8,52) (9 606) LC185) (110,6) (85,1) (76,16) 7 10438 ou 10487). 


19, Usando os dados do Probl. 10, calcular um número fn- 
- dice de Paasche dos preços, para o ano de 1958, adotados como 
básicos (a) o ano de 1949 e (b) o período de 1949 a 1950. 


Solução: 


(a) Índice de Paasche = índice agregativo dos preços com as quantidades do 
período básico.como pesos = 


x Pr q. “B (pregos em 1958) (quantidades em 1958) 
Ž poga . E(preços em 1949) (quantidades em 1958) 


E (4,13) (10436) + (59,7) (115,5) + (28,9)(82,79) _ 
(3,95) (10436) -+ (61,5) (115,5) +(34,8) (82,79) 


103,93 ou 103,4 9%). 
2 Y Etr 

(b) Índice de Paasche = E 

E i Z Po qn 


14 
= E (preços em 1958) (quantidades em 1958) | 
E (preços em 1949-50) (quantidades em 1958) — 


— 1413) (10 436) + (59,7),(115,5) + (38,9) (82,79) 


[j 


104,43 ou 104,4(%). 


“= “755,43 milhões de dólares 


(3,92) (10 436) + (61,85) (115,5) + (35,1) (82,79) — dei 
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20. Determinar os números índices de (a) Laspeyres e (b) Paas- 
chep pará os dados do Probl. 12. (e) Expor uma vantagem do índice 


. de Laspeyres sôbre o de Paasche, quando as revisões dos números 


índices são feitas de ano em ano. 


- Solução: 


Bongo 
2 po go 


(a) Índice de Laspeyres = 


_ E (preços em 1958) (quantidades em 1949) _ 
7 E preços em 1949) (quantidades em 1949) 


(828,20 p/t) (3,559 milhões t) + (80,214 pigal.) (80,2 X 42 milhões gel) Pi 
(820,13 p/t) (3,559 milhões t) + (80,203 p/gal.) (80,2 X 42 milhões gel.) 


821,20 milhões de dólares = 108,71 ou 108,7(%). 


Note-se que é muito importante que a8 unidades empregadas sejam corretas e 
coerentes. 2 


Epa 


(b) Índice de Paasche = PPPN 


_ Efpreços em 1958) (quantidades em 1958) | 
= S (preços em 1949) (quantidades em 1958) 


(828,20 p/t) (1,821 milhões t) + (30,214 p/gsl.) (118,6 X 42 milhões-gal) 
(820,13 p/t) (1,821 milhões t) + (30,203 p/gal.) (118,6 X 42 milhões gal.) 


— Wt7,33 milhões de dólares _ 
= 1047,84 milhões de dólares — 


106,63 ou 106,9(%). 


Na prática, quando um número índice deve ser calculado para muitas utili- 
dades, é conveniente dispor os cálculos sob a forma de uma tabela adequada (veja 
o Probl. 31, por exemplo). 

(o) Ao calcular um índice de Laspeyres, 08 pesos (quantidades produzidas cu 
consumidas. no ano base, quando fôr calculado um indice de preço) não se alteram 
de ano para ano, Nesse caso, apenas precisam ser obtidas as informações sôbre 
os preços mais recentes. 

Ao calcular um índice de Paasche, deve ser obtida a mais recente informa- 


ção sôbre os pesos (quantidades) bem como sôbre os preços. Portanto, o cáleulo 
do índice de Paasche implica em mais trabalho para a coleta dos dados. 


21: Apresentar uma interpretação dos números índices de 
preço de (a) Laspeyres e (b) Paasche, com referência ao valor total 
(ou cústo total) das utilidades. 


540 ESTATÍSEI 
Solução: 


(a) Ao calcular um Índice de preço-de Laspeyres, Z po go representa o valor 
total (ou custo total) de um conjunto de bens, serviços où utilidades (às vêzes 
denominado bólsa do mercado) no ano ou período básico. A quantidade È pu go 
representa o valor total desse mesma bôlsa, no ano ou período dado. Por isso, 
um índice de preço de Laspeyres serve para medir o custo total, em qualquer axo 
dado, de uma bólsa de mercado de utilidades adquiridas no ano básico. 


(b) Ao calcular um índice de preço de Paasche, D poga 6 o valor total (ou 
custo total) das utilidades adquiridas, no ano dado, admitidos os preços do ano 
básico, enquanto © pr gn é o valor total das utilidades adquiridas, no ano dado, 
aos preços dêsse ano. Portanto, um índice de pregos de Paasche serve para medir 
o custo total de uma dbólsa de mercado referido ao valor que teria, se a compra. tives- 
se sido efetuada no ano básico. 


22. Estabelece-se; às vêzes, que o índice de preço de Laspeyres 
tende a superestimar as variações de preço, enquanto o índice de 
Paasche tende a subestimá-las. Apresentar uma razão possível que 
comprove esta, proposição. 


Solução: 


De acôrdo com'a lei econômica dg oferta e da procura, as pessoas tendem a 
„comprar menos quando os preços são altos e mais quando êles são baixos. Esta 
é a denominada demanda clástica, que é válida quando à necessidade dos utilidades 
não é absolutamente essencial G 


No caso do índice de Laspeyres, Z pa go será algo maior do que deveria ser 
porque, de acôrdo com a lei da oferta e da procura, as pessoas tendem a comprar 
menor emantidade de utilidados de alto prego e maior quantidade das de menor 
preço, de modo que o custo total séria menor do que o previsto por meio de È pa Go 


= 
Portanto, o índice de Laspeyros, So tende a ser maior do que deverie ser. 
Po Go 
No caso do índice de Paasche, os papéis desempenhados pelas quantidades 
do ano base e do ano dado são permutados, em relação aos do caso do índice de 
Jaspeyres. ssa permutação tende a tornar o índice de Paasche interior ao que 
deveria ser. 


O raciocínio acima não significa que o índice de Laspeyres é senpre maior 
do que o de Paasche mas, sômente, que êle tende a sê-lo. Na prática, o índice de 
Laspeyres pode ser maior, menor où igual ao de Paasche (veja os Probls, 18 
e 19, em que ò índice de Laspeyres é, de fato, menor que o de Paasche). 


23, Provar que os números índices agregativos ponderados de 
preços, com pesos fixos (quantidades), satisfazem ao teste circular 
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Solução: 


a Se go representa os pesos fixos, tem-se, para quaisquer períodos a, be c, 08 
números índices 


r = Pogo a to = Eeke 
o = E paqo oT Ep go 
Então, 
E Pe Qo 
PA =% =I 
Tat Tie = S pago Epa qo 


o que mostra que o teste circular é satisfeito. 
Os números índices de Laspeyres e Paasche não satisfazem ao teste circular. 


Índice ideal de Fisher 
24. Mostrar que o índice ideal de Fisher é à média geométrica 
dos números índices de Laspeyres e de Paasche. 


Solução: 


Se F, Le P representam os números índices de FERIE Laspeyres è Paas- 
che, respectivamente, tem-se 


Èp ) 5 
Em: (ue) (5 Spoin 


t) = = VLP, 


adotadas as definições de Le P. Como VLP én média geométrica de Le P, con- 
clui-so pelo resultado desejado. 7 


25. Provar que o índice ideal de Fisher está compreendido entre 
os números índices de Laspeyres e de Paasche. 


Solução: 

Essa próposição decorre imediatamente do fato de que F, por ser igual a 
VLP, está situado entre Le P, porque Le P são números positivos. Note-se 
que, se L = P, então F = L = P. 


“Como, de acôrdo com o Probl, 22, L tem uma tendência de superestimar as 
variações dos preços, enquanto P tem uma tendência de subestimá-las, segue-se que 
P, que está situado entre Le P, proporcionará melhor estimativa do que Lou P. 


26. Determinar o índice ideal de Fisher de preços para os 
produtos de laticínio do Probl. 10, para o ano 1958, admitidos 
como básicos (a) o ano de q e (b) o período de 1949 a 1950. 
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Solução: ` 
E 
(a) P=VLP = (109,84)(1093,93) = 103,9, de..atôrdo com us Probis. 
1a) e 19X%a). ps 
- (b) F= VLP = (104,33) (104,43) = 1044, de acórdo com os Probis. 
18(b) e 196), à 


27. Deterininar o índice ideal de Fisher de Preços para os dados 
do Probl. 12. 


Solução: G 


De acórdo com o Probl, 20, F = VLP = = V (108, 71) (106,63) 63) = 107,7. 

Note-se que uma. boa aproximação para VIP, LP, quando Le P são aproxima- 
damente iguais, é dada por 3 (L + P). Essa média aritmética de Le P pode ser 
usada como a definição de um nôvo número índice, situado entre Le P. 


28. Provar que o índice ideal de Fisher satisfaz 20 teste da rever- 
sibilidade do tempo. 
Solução: 


“Seja Fom O número índice ideal de Fisher para um ano dado, referido a um 
ano básico, é Fnjo O índice ideal de Fisher, quando o ano base e o ano dado 
são permutados. - Então, o teste da reversibilidade do tempo será satisfeito sê 


Fom = 1/Fno ou Fop Pnjo = 1. 
Por definição, 


rede o (ee) Ge de) G Po 2) 
Pom = . Então, Pno = 4 (328E) (SPodo 
da Gt Po Qo Ges) iga do Epa) (pn qo) © 
Pom Pap = JG: e) (gre) G pet) G Po a) 25 
A E po go) NE poqa? \E pngna? NE Pn qo i 


29. Calcular o índice de Marshall-Edgeworth de preço, para 
os dados do Probl. 12. . 


Solução: 


Z palo + an) 
E polgo + qn) 

 Elpreços em 1958) (soma das quantidades em 1949-e 1958) _ 
E = Epreços em 1949) (soma das quantidades em 1949'e 1958) 


_ (828,20) (25559 + 1,821) (109) + (80,214) {(80,2 2 hise) a2 + 109) 
= (820,18) (3,559 + 1,821) (109) + (80,203) (80,2 -F 118,6) (42 X 109) 


1938,5 “o, ; 
= 18085 7 005 (08). 


Índice de Marshall-Edgeworth = 
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Note-se que êsse valor está compreendido entre os números fúdices de Las- 
peyres e dé Paasche (veja o Probl. 20). Para uma verificação de que é sempre 


ês o caso, veja o Probl. 30. 


X Y, o X, tY 

30. (a) Provar que, se a <7 então S < EFT, 

< + , em que Xy, Xz, Yı, Ya são quaisquer números positivos, 
2 


< 


(b) Usar o resultado do item (a) para provar que o número 
índice de Marshall-Edgeworth está compreendido entre os números 
índices de Laspeyres e Paasche. 


Solução: 
Zn DX < KoF 
(0) Se So <p então (1) XY Ya 


Somando-se X1X3 à ambos os membros da expressão (1) tem-se XX, 4 Ki Vo< 


Xr M+tY 
<XiXo + XY, ou Xi(Xa + Ya) < Xa(Xı + Yı), ou (2) E < ARA A 


mediante a divisão de ambos os membros por X4X: + Yə). 


Somando-se YiYa 2 ambos os membros da expressão (1), tem-se XY: + 
LF < XaYı + YıYo ou Ya(Xi + Yi) < Mto + Y) ou 


MAM Yi 
68) Xo + Ya S ro! 


mediante à divisão de ambos os membros por Yı(Xı + Y) 
De (Be (3) decorre o resultado desejado. ' 


(b) Caso 1. O índice de Laspeyres é menor do que o de Paasche. 
Sejam Xi = È Pn qo Xo = È po qo, Yı = È Pn qu Yo = È po qu- 


Então. r ae EA X de modo que, de acôrdo com (a), 
á X2 Yo 


png Epro Epa < Prt 
È pogo ` pogo +Èpogn ` È potn 


È Pago Z pn (go + an) -2 
E pogo ` È polao + qa) 


ou 


o índice de Laspeyres < índice de Marshall-Edgeworth < indice de Paasche 


on 
pN 
E 
p 
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Caso 2, O índice de Paasche é menor do que o de Laspeyres. 
Sejam Xi = E pa Qm Ko = È po qm Yı = È pago Yo = È Po go- 
EDR A 


Então, E A 


de modo que, de acôrdo com (a), 


Epam o Bpr dh Epago -È prg 


Š pojn ` È pagn +È pogo ` È poqo 


Èpo Epal Ega) Eram 


ou x <a r 
E poqa ` E polqe + 9a) ` È Ppoqn 


ou Índice de Paasche < fndice de Marshall-Edgeworth < índice de Laspeyres. 


De acôrdo com os casos 1 e 2 conclui-se que, independentemente do índice de 
Laspeyres ser maior ou menor do que o de Paasche, o de Marshall-Edgeworth 
estará compreendido entre êles, 


Média ponderada de relativos 


31, Calcular uma média aritmética ponderada de preços rela- 
tivos, para os dados do Probl. 12, adotados como pesos os valores do 
ano (a) dado c (b) básico, sendo o ano-básico 1949 e o dado o de 1958. 


Solução: 


(a) Média aritmétiea ponderada de preços relativos, adotados os valores do 
ano dado como pesos == 


E (preços relativos) (valores do ano dado) 
È (valores do ano dado) 


s podem ser dispostos como na, Tabela 17.12, na qual 
v © gno dado, 8, o Índice. o o ano básico, 1949, e p e q re- 
preços o as quantidades. 


| i T 
i Pag: 
po (milhões de 
i 1 dólares) 
ela ~ la 
Carvão de $0,13 | 5 71,939 
pedra (por 


tonelada) | to 


Gasolina S “t085,077 1123753 
Bpr gn = Pipi ppi g= 
= 1117,329 = 1195,602 


sa 
re 
R 
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Então, o núméro índice: desejado = 


— Z (pripo) (Page) 11956 


= 107,0 5 
= Spam 107, OC 


(b) A média aritmética ponderada de preços relativos, adotados os valores 
do ano básico como pesos, é 


Z (Pnipo) (p040) „ZP indice de Laspeyres do Probl. 20(a) = 108,/7(%). 
È po qo E po qo 


Pode-se também proceder como no item (a), mediante a elaboração de uma 
tabela. 
Números índices de quantidade ou de volume 

32. Usar os dados do Probl.. 12 para calcular um índice de 


volume para 1958, adotado como ano básico o de 1949, por meio de: 
(a) uma média aritmética simples de volumes relativos; (b) um índice 


. agregativo ponderado de volumes com os preços do ano básico como 


.pesos; (c) um índice agregativo ponderado de volumes, com os 
preços do ano dado como pesos. 


Solução: a 7 


(0). Média. aritmética simples dos índices de volumes relativos = 


Equlto _ 1821/3559 + 118,6/80,2  5117(%) HATE (gg 5), E 
EENE T: 2 2 i ci 


(b) Índice agregativo ponderado de volumes, com os preços do ano base 


como pesos = , 


Egnpo 5 (quantidades em 1958) (preços em 1949) 


Go Po = E (quantidades em 1949) (preços em 1949) ; 


1,821 milhões t) (320,13 por t) + (118,6 X 42 milh gal.) (80,203 por gal.) z 
3,559 milhões t) (820,13 por t) + ( 80,2 X 42 milhões gal.) ($0,203 por gal.) 


ilhões de dólares. 138,71 ou 138,7 (%). 
3 milhões de dólares 


“Esto é às vêzes denominado indice de Laspeyres, de volume ou de quantidade. 
(o) Índice agregativo ponderado de volumes, com os preços do sno dado 


como pesos = 


Tom Pa Z (quantidades em 1958) (preços em 1958) = 
“É Egopn E (quantidades em 1949) (preços em 1958) 
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= 41,821 milhões t) (828,20 por t)+(118,6 X 42 milhões gal.) (30,214 por gal) 
(3,559 milhões t) (828,20 por t)+( 80,2 X 42 milhões gal.) (30,214 por gal.) 
nais ca 


: H7,93 milhõês de dólares 


7 821,20 milhöşsde dólares j 


= 136,06 ou 136,1(%). 


Este-é, asrvêzes, denominado número índice de Paasche, de volume ou quantidade, 


33, Por meio dos refultados do Probl. 32, determinar o nú- 
mêro índice de volume ou de quantidade ideal, de Fisher. 
Solução: ’ 


Como os índices de preço, o índice de volume ideal de Fisher é dado pela média 
geométrica, dos números índices de volume de Laspeyres e de Paasche. Então, 
de acôrdo com o Probl. 32, 


Número índice de volume ideal de Fisher = V (138,71) (136,06) = 137,4. 
Números índices de valores 


34. Provar que o índice ideal de Fisher satisfaz ao teste de rever- 
sibilidade dos fatôres. 
Solução: 


O teste de reversibilidade dos fatôres será satisfeito se o índice fór tal que: 
(índice de preço) (índice de quantidade) = índice de valor. 


Sejam Pp e Fo, respectivamente, o índice ideal de preços- o de quantidade, 
ambos de Fisher, Então, 


re ro = y (tr) (Zhe) qG») Etap) Bah 
Epo qo? NÈ po Qn Z qo po) NE qo pn È po go 


= Índice de valor, de modo que o índice ideal de Fisher satisfaz ao teste de rever- 
sibilidade dos fatôres. 


45. Calcular o índice de valor do Probl. 34, para os dados do 
Probl. 12, 


Solução: 
Como o resultado: 
“Índice de or = (índice de preço) (índice de quantidade) prevalece exata- 


mente quando é usado o Índice ideal de Fisher, obtém-se, de acôrdo com os 
Probls. 27 e 38, 


im 


de valor = (107,7%)(137,4%) = 148,0(%). 
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2 png 


> ste resultado também pode ser obtido pela substituição direta em SE 


; : Pa 7 gge 
Mudança do período básico dos números índices 


36. Estabelecer a validade do método do Probl. 3 para a ob- 
tenção de preços relativos, referentes ao nôvo período básico, 


Solução: 


Admita-se que os períodos são numerados consecutivamente, de 1 a N, como 
na primeira linha da Tabela 17.13, e sejam pu Pa... Py OS preços dêsses perío- 
dos, constantes da segunda linha da tabela. 


Tabela 17.13 


mm EEEE ii 
i j N 
Periodo i 1 2 3 age j k 
Preços PI Po P3 P; E Pk PN 
pe a o A cem 
Preços relativos j aii 
Sorapondëntes aoj Pii Pita Pita a 100% wes Pill IN 
período primitivoj 
Preços relativos i E a 5 
cormsspondentes ao) Pkf1 Pkl Pkl gfs Pkij 100% É kiN 
período nôvo k . 
e 


Os preços relativos correspondentes a08 períodos j € k, denominados primi- 
tivo e nôvo, respectivamente, estão dispostos nas 3.º e 4.º linhas da, tabela. Neste 
caso pin =:py/Pj» Pie = papi eto. 

É claro que a quarta linke pode ser obtida da terceira, mediante & divisão de 
cada case por piik, isto é, preço relativo do período k referido ao período jf tomado 
como base. 


Por exemplo: 


Bit a pulei = PL Pkn ete. 
Pik  Pelpi Pk 
Os resultados são claramente aplicáveis a quantidades e valores relativos, 


“bem como a preços relativos, ` 


37. Provar que o método do Probl. 36 para a mudança do 
período básico dos números índices sômente é aplicável quando os 
números índices satisfazem ao teste circular. 
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Solução: 
(1) Se Än Bits... fit representam os números Índices, para os vários pi 
ríodos, com o de ordem j tomado como básico, e Taj, Iriz, «.. IktN OS números 


índices córrespondentes, tomado o período k como básico, obter-se-á à segiiênci 
(2) mediante a divisão de cada têrmo da seqiiência (1) por Tjik, sómente quando 


UL = Iki dit 


= ef 
jik Liik K 


ou: 
Eme Litro Tje = Ijik» Ditos coa 


o que implica nos números Índices satisfazerem ao teste circular, 


Como os números índices de Laspeyres, Paasche, Fisher e Marshall-lidge- 
worth não satisfazem ao teste circular, o método pera mudança de base não Jhes 
é aplicável exatamente: Entretanto, na prática, há aplicação aproximada. 


Os números índices agregativos ponderados, com os pesos de um ano fixo, 
satisfazem ao teste circular (veja o.Probl. 23). Aos números índices calculados 
dessa maneira, o método apresentado para » mudança de base tem aplicação exeta. 


38. A Tabela 17.14 apresenta o índice da produção indus- 
trial de.tôdas as manufaturas nos anos de 1947 a 1958, com o pe 
ríodo de 1947 a 1949 como básico. Obter um nôvo índice, adotaudo 
como básicos (a) o ano de 1951 e (b) o período de 1953.a 1956. 


“Tabela 1714 


CR E T 
Anos 1947 | 1948 | 1949 | 1950] 1951 | 1952 | 1953 | 1954 | 1955 | 1956 


“Índice da produção j 
industrial 100 | 104 | 97 |112 | 120 | 124 | 134 | 125 | 139 
(1947-49 «= 100) k 


—r 
1957 


Fonte: Survey of Current Business 
- Solução: 


ta) Divide-se cada índice da tabela por 120 (índice correspondente 8 1951} 
e exprime-se o resultado em percentagem. Os números índices desejados, refe- 
ridos ao ano básico de 1951, figuram na Tabela 17.15. ` 


Tabela 17.15 
| | 
Anos 1947 | 1948 | 1949 | 1950 a 1953 | 1954 | 1955] 1958) 1 
Índice da produção 
industrial a3 | s7 | 81/93 | 100/13 112 |10 | 118 
(1951 = 100) | 
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O indice médio para os anos, 1953-1956 como base é ? 
34 + 125 + 130 + 143) 35,25. Então, dividindo-se onda, índico de 
Tabela 17.14 por 135,25 e expri o-se os resultados em percentagera, obtém-se 


os números índices deseje dos, constantes da Tabele 37.16. 


Tabela 17.16 


Aros fem | wa] 1949 ro] 1951 
na a Lon Ea 
f 
i 


IT 
Índice da produs ! 
são industrial 74 | q w 


(1953-56 == .100) 


Note-se que o índice médio do nôvo período básico de 1953 a 1956 é 09 + 
+ 92 + 103 + 106) = 100, como deveria ser. 


Deflação de séries temporais 


39, A Tabela 17.17 apresenta os salários médios, em dólares 
por hora, dos ferroviários, OS Estados Unidos, durante os anos de 
1947 a 1958. Apresenta, também, os índices de preços para O con- 
sumidor daqueles anos, referidos ao período básico de 1947 a 1949, 
Determinar os salários “reais” dos ferroviários, durante os anos de 
1947 a 1958, comparados com os de 1947. 

a temem tam mamar vo mio cata AH cem cao rosto dem 


e em eme, 


Anos 1947 1948 1949 1950 1951 1952 1953 1054 1955 1956 1057 1958 


Salários médivo də 
opsrários ferroviários 
(dólares por hora) 


| 1,19 1,32 144 1,57 1,75 1,84 1,89 1,94 1,97 2,13 2,28 2,45 


pin Do Pe 95,5 102,8 101,8 102,8 111,0 218,5 114,4 114,8 114,5 116,2 120,2 123,6 
(1947-49 = 100) 


Fonte: U.S. Depurtment of Labor 


Solução: 

(a) Celculam-se, primeiramente, novus indices de preço para o consumidor, 
referidos 20 gno básico de 1947, mediante" divisão de todos os números da terceira 
linha da Tabela 17.17 por 95,5 e exprimindo os resultados em percentagem, o 
resultado aparece ne segunda linho da Tabela 17.18. Divide-se, então, cada sald- 
rio médio dos snos dados (segunda linha da Pebela 17.17) pelo número índice 
correspondente (segunda, linha da Tabela 17.18), para obter-se o salário “raat? 
(terceira linha da Tabeis 17.18). é 


45/1293% 


0,9 salário 
que dolzado, 


Dessa forma, pore: 


= 81,89. Conclui-se qua, ore o 


ESTATÍSTICA 


“de 1947 a 1048, o “real” aumentou apenas de 59%, istot; o poder aquisitivo apenas 
“aumentou de 50%. 


Tabela 17.18, 


Anos 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 


+ r 
Índice dos presòs 


para o consumidor 100 107,8 106,6 107,6 116,2 118,8 119,8 120,2 119,9 121,7 125,9 129,3 
(1947 = 100), 


Salários “reais” dos 


operários ferroviários | 1,19 1,24 1,35 1,46 1,51 1,55 1,58 1,61 1,64 175 1,81 1,89 
(dólares por hora) fi 


40. Usar o índice de preço para o consumidor do Probl. 39 
para determinar o poder aquisitivo do dólar nos vários anos, admi- 
tindo-se que, em 1947, o dólar tinha realmente êsse valor, quanto 
ao poder aquisitivo. f 


Solução: 


Dividindo-se $1,00 por cada índice de preço da segunda linha da Tabela 


17.18, obtém-se as casas da Tabela 17.19 que mostram o poder. aquisitivo do dó- ` 


lar de"1947 em cada um dos anos dados. Em 1958, por exemplo, a casa 0,77 sig- 

nifica que um dólar de 1958 poderia comprar sômente 77% do que poderia 

fazê-lo um de 1947, isto é, o dólar foi avaliado em $0,77, referido ao de 1947. 
Diz-se que os dados enunciados em função do valor de um dólar, em algum 


período específico de tempo, são expressos em dólares constantes, com aquêle perío- 
do considerado como básico ou de referência. 


Tabela 17.19 


T T 


Anos E 1948 | 1949 | 19501 1951 g 1953 | 1954 | 1955 | 1956 | 1957 |1958 


Poder aquisitivo a 
do dólar de 1947 | 1,00 | 0,93 | 0,94 | 0,93 | 0,86 | 0,84 | 0,83 | 0,83 | 0,83 | 0,82 | 0,79 | 0,77 


Problemas Suplementares 
Preços relativos 


41, A Tafela 17.20 aprésenta os preços médios de trigo, por atacado, em 
vários anos. Determinar os preços relativos em (a) ano de 1958, adotado o 
ano de 1948 como básico, (b) período de 1949 a 1956, adotado o ano de 1950 como 
básico, (e) período de 1955-1958, adotado o período de 1947 a 1949 como básico. 

Resp.: (a) 89,2; (b) 97,8; 104,4; (c) 101,4; 96,9;-95,3; 90,4: 
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Tabela 17.20 


Anos 1947 1a 1952 | 1953 


soss [1955 1956| 1957 | 1958 


1948 1s] 1950 


+ 


P: édio do trigo R 
Prese médio do bus 2,66 | 2,50 | 2,24 | 2,29 | 2,41 | 2,45 | 2,49 | 2,56 | 2,50 2,39 | 2,35 | 2,23 
hel (60 libras) 


Fonte: Department of Commerce 


42. Provar que (a) Pelo pèle Poja = 1, (B) Paio Pole Peid = Pol: 
43. Provar que pom = Poj Puz Pas -.- Ponin 


44. Provar.que a propriedade circular modificada decorre diretamente da 
propriedade circular e da de reversibilidade do tempo. 


45. A Tabela 17.21 apresenta os preços. relativos de uma utilidade, com 
1047-1949 = 100. Determinar os preços relativos com (a) 1956 = 100, (b) 
1955-1956 = 100. 


Tabela 17.21. 


Anos 1955 | 1956 


Preços rel ativos 


(1947-1949 = 100) 135 | 128 


Resp.: (a) 105; 100; 93,8; 117; 109; 127. (b) 103; 97,3; 91,3; Má; 106; 123. 


46. O preço relativo do ano de 1956, com o de 1958 como básico, é 62}, en- 
quanto que.o de 1957, com o ano de 1956 como básico, é 1334 . Determinar o 
preço relativo do ano de 1958, adotados como básicos (a) o ano de 1957, (b) o 
„período de 1956 a 1957. 

epi (a) 120, (b) 137. 


47. Em 1960, o preço médio de uma utilidade diminui de 25% de seu valor 
em 1954, mas aumentou de 50% de seu valor em 1946. Determinar, adotado 
como básico o ano de 1946, os preços relativos de (a) 1954 e (b) 1960: 


Resp.: (a) 200, (b) 150. 


Quantidade ou volume relativos 


48. A Tabela 17.22 apresenta à energia elétrica, em bilhões de Kilowatt- ho- 
ras, vendida a consumidores residenciais ou domiciliares, nos Estados Unidos, du- 
rante os anos de 1947 a 1958. Reduzir os dados a quantidades relativas, ad- 
mitidos como básicos (a) o'ano de 1953 e (b) a período de 1947 a 1949. 


CADA ic ESTATÍSTICA 


Tabela 17.22 


1951 iss | 103 o os iasr 1958 


Anos 1947 | 1948 | 1949 | 1950 


Energia elétrica | 3,68 | 4,25 | 4,84. 5,59 | 8,42 | 7,23 | 8,00 | 9,04 [10,04 [11,15 


(bilhões de kwh) 12,26 | 13,25 


i TPE 


Fonte: Survey of Current Business 


Resp.: (a) 45,5; 52,5; 59,8; 69,1; 79,4; 89,4; 100; 111,7; 124,1; 137,8; 151,5; 


163,8. (b) 86,5; 99,8; 113,7; 131,3; 150,8; 169,9; 190,1; 212,4; 
235,9; 261,9; 288,0; 311,3. 


49. Em 1956, a produção de minério metálico aumentvu de 40% sôbre a de 
1955. Em 1957, a produção era 20% inferior à de 1956, mas 164% superior à 
de 1958, Determinar os preços relativos do período de 1955a 1958, adotados como 
básicos, (a) oano de 1955; (b) o ano de 1958; (c) o período de 1955 a 1958. 

Resp.: (a) pi 140, 112, 96, (b) 104, 146, 117, 100, (c) 89,3; 125; 100; 

'85,7, 


50. No problema precedente, se a produção de minério metálico do ano de 
1957 erá de 3,20 milhões de toneladas, determiriar a produção para os anos de 
(a) 1955, (b) 1956, (e) 1958. 


Resp.: (a) 286; (b) 4,00, (c) 2,74 milhões de toneladas. 


Valores relativos 


51 Em 1960, o preço de uma utilidade aumentou de 50% sôbre a de 1952, 
enquanto a” quantidade proódtisida diminuiu de 30%. De que percentagem o 
valor total, em dólares, da utilidade, em 1960, aumentou ou diminuiu em relação 
ao valor de 1952? 


Resp.: (a) Aumentou de 5%. 
52. A Tabela 17.23 apresenta os pregos e os valores relativos de uma utili- 
dade nos anos de 1956 a 1960, admitidos os períodos básicos indicados. De- 


terminar as quantidades relativas da utilidade, adotados como básicos, (a) o ano 
de 1956 e (b) o período de 1956 a 1958, Interpretar os resultados. 


Tabela 17.25 


Valores relativos | 150 | 180 
(1947-1949 = 100) 


Anos 1956 | 1957 | 1958 | 1959 | 1960 
Preços relativos 100 | 125 200 
(1956 = 100) s 

207 | 231 | 252 


Resp.: (a) 100; 96; 92; 88: 84. (6) 104; 100; 96; 92: 88. 
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Elos 'e cadeias relativos. 

a 58. Os elos relativos do consumo de uma utilidade, durante os anos de 1957 
a 1960, são 90, 120, 125 e 80, respectivamente. (a) Determinar o preço relativo, 
em 1958, adotado o ano de 1960 como básico. (b) Encadear os elos relativos, 
referidos 20 ano de 1959 como básico. (c) Encadear os elos relativos, referidos 
ao período de 1957 a 1958 como básico. 

Resp.: (a) 100, (b) 74,1; 66,7; 80,0; 100; 80,0, correspondentes aos anos de 
1956 a 1960, respectivamente: (c) 101; 90,9; 109; 136; 109, correspondentes aos 
anos de 1956 a 1960, respectivamente, 

54. Ao fim do primeiro de n anos sucessivos, & produção de uma utilidade 
foi de A unidades. Em cada ano sucessivo, a produção aumentou de r% sôbre a 
do anterior. (a) Mostrar que a produção, durante o enésimo, é de A (rj 100)" 
unidades. (b) Mostrar que a produção total, de todos os n anos, é de (10044) 
KA + 7/1007? — 1] unidades. 


Números índices. Método agregativo simples 


55. A Tabela 17.24 apresenta os preços e as quantidades consumidas de vários 
metais não-fexrosos, nos Estados Unidos, nos anos de 1949, 1956 e 1957. Tomando 
o ano de 1949 como básico, calcular os índices de preço, mediante o emprêgo do 
método agregativo simples, para os anos (a) de 1956; (b) de 1957. 


Resp.: (a) 121,7; (b) 110,1. 
Tabela 17.24 


Preços Quantidades 
~-= u (cents por libra). a- o. (milhões de libras)... one 
REGONE aaepe 
1949 1956 1957 1949 1956 1957 


Alumínio 17,00 26,01 27,52 1357 | 3707 2 698 


Cobre 19,36 41,88 29,99 2144 | 2734 2478 
Chumbo 15,18 15.81 14,46 1916 | 2420 2276 
Estanho 99,32 | 101,26 96,17 161 202 186 
Zinco 12,15 13,49 11,40 1872 | 2018 1424. 


Fonte: The Conference Board and Survey of Current Business 

56. Provar que um número índice agregativo simples satisfaz nos testes de 
reversibilidade do tempo e circular, mas não satisfaz ao de reversibilidade dos 
fatôres. 


Método da média simples de relativos 

57. Por meio dos dados da Tabela 17.24 do Probl, 55, adotada ums média 
simples (aritmética) de preços relativos, obter um índice de preços de metais não- 
-ferrosos, admitido o ano de 1949 como básico, para os anos de (a) .1956 e 
(b) 1957. Comparar com o Probl. 55. 

Resp.: (a) 137,3; (b) 120,5. 
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58..- Resgjver o Probl. 57, usando a mediana, 
“Resp: (0)-111,0; (b) 96,8. 


59. . Resólver o Probi. 57, usando a média geométrica. 
(aj 131,3; (0) 116,8. 


60. “Resólvor o Probl. 57, usando a média harmônica. 
Resp: (a) 126,3; (b) 113,3. £ 


` Método agrégativo ponderado. Índices de Laspeyres e Paasche 


61. Por meio dos dados da Tabela 17.24 do Probl. 55, obter um índice de 
preço de Laspeyres, admitido o ano de 1949 como básico, para (a) 1956 e (b) 1957. 
Resp.: (a) 148,7; (b) 125,5. 


62. Por meio dos dados da Tabela 17.24 do Probl. 55, obter um fndice de 
Paasche, admitido o ano de 1949 como básico; para (a) 1959 e (b) 1957. 
Resp: (a) 150,5; (b) 134,2. 


63. Mostrar que os índices de (a) Laspeyres e (b) Paasche não satisfazem 
aos testes de reversibilidade do tempo ou dos fatôres. 3 


Índice ideal de Fisher 


64. Por meio dos dados da Tabela 17.24 do Probl. 55, obter o índice de preço 
ideal de Fisher, admitido o ano de 1949 como básico, para (a) 1956 e (b) 1957. 
Resp.: (a) 149,6; (b) 129,8. 


- 6%. Mostrar que o índice-ideal de. Fisher. não satistaz ao teste circular, , 
Índice de Maxshall-Edgeworth 


46. Por meio dos dados da Tabela 17.24 do Probl. 55, obter um índice de 
preço de Masshall-lidgeworth, admitido o ano de 1949 como básico, para (a) 1956 
e (b) 1957.-0 : É 

Resp.: (a) 149,8; (6). 130,5. 


67. Mostrar que'o índice de Masshall-Edgeworth satisfaz ao teste da rever- 
sibilidade. do tempo mas não o de reversibilidade dos fatóres. 


Método da média ponderada de relativos 


68. Por meio dos dados da Tabela 17.24 do Probl. 55, obter os números 
índices da média ponderada de relativos para os anos de 1956 e 1957, considerado 
1949 como “o ano básico; empregando conio pesos (a) os valores do ano dado, 
(b) os valores -do ano básico. i è 
7 i) 163,8; 141,4; (b) 148,7; 125,5. 


Números fadices de «quantidade ou de volume 

69. Usar os dados da Tabela 17.24 do Probl. 55 para calcular os índices 
de volume, para 1956 e 1957, adotado como básico o ano de 1949, por meio de 
(a) média apitmética simples de volumes relativos; (b) média geométrica simples 
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de volumes relativos; (c) índice agregativo ponderado de volumes, adotados 
para pesos os preços do ano básico (número índice de volume de Laspeyres); (d) 
“Indice agregativo ponderado de volumes, adotados para pesos os preços do ano 
dado (número índice de volume de Paasche); (e) índice ideal de volume de Fisher; 
(J) índice de volume de Marshall-Edge worth. 

Resp: (a) 152,1; 139,7; (b) 142,8; 126,9; (0) 149,0; 136,8; (d) 150,7; 148,3 
(e) 149,9; 141,5; (J) 150,0; 142,1. 


Números índices de valores 


70. (a) Adotado o ano de 1949 como básico, nos dados do Probl. 55, cal- 
cular o índice de valor para cada um dos anos de 1956 e 1957. (b) Verificar que o 
índice de valor do item (a) é igual ao obtido pelo produto dos índices ideais de 
Fisher e o de quantidade. 

Resp.: (a) 224,2; 183,6. 


71. Admitido o ano de 1949 como básico, nos dados do Probl. 55, calcular o 
produto “índice de preço” X “índice de quantidade”, para os anos de 1956 e 
1957, usando os números fndices (a) de Laspeyres e (b) de Paasche. Comparar 
com o verdadeiro índice de valor. i ` 

Resp.: (4) 221,6; 171,7; (b) 226,8; 196,3. Os valores verdadeiros são 224,2 
e 183,6, respectivamente (Probl. 70). i ot 


72. Provar que os números índices agregativos simples de valores satisfazem 
aos testes de reversibilidade do tempo e o circular, 


Mudança de período básico dos números índices 


73. A` Tabele 17.25 apresenta dois índices de- custo da construção para os 
anos de 1947 e 1958. O primeiro, baseado na média de 30 cidades e compilado - 
pela “Américan Appraisal Company”, refere-se ao ano básico 1913 = 100. O, 
segundo, compilado “pelo “Department of Commerce”, é referido ao período 
de 1947 a 1949 = 100. (a) Usando os dados, para 1913 = 100, obter um 
índice para 1947-1949 = 100, pelo método simples da mudança de hase, empre- . 
gado para os preços relativos. (b) Comparar o resultado do item (a) com a 
compilação do “Department of Commerce”, relacionando as razões possíveis de 
qualquer discrepância observada. 


Tabela 17.25 


Anos 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 


Índice de custo da 
construção da 
Amer. Appraisal Co. | 430 490 490 500, 532 553 577 501 608 635 663 682 

41913 = 100) 


- Índice de custo da 3 
construção do 

Dept of Commerce | 03 104 103 107 ilẹ 119 122 122 125 132 137 149 

(1947-1949 = 100) É J 


Fonte: Survey of Current Business 
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Detlação de séries temporais 


74. Os índices de preços por atacado nos Estados Unidos, para os anos de 
1947 a 1958, para o período básico de 1947 a 1949 = 100, estão relacionados na 
Tabela 17.26. Determinar o poder aquisitivo, por atacado, de um dólar, em 
cada um dos anos dados, referido ao dólar de 1954. 

' Resp.: 1,14; 1,06; 1,11; 1,07; 0,96; 0,99; 1,00; 1,00; 1,00; 0,97; 0,94; 0,93. 


Tabela 17.26 


Anos 1047 | 1948 | 1949 | 1950 | 1951 | 1952 | 1953 | 1954 | 1955 toa 1057 | 2058 


Índice de preço . 
é por atacado 96,4 [104,4 | 99,2 [103,1/114,8/111,6 110,1 [110,3 [110,7 | 114,3] 117,6] 119,2 
(1947-1949 = 100) š 


Fonte: Survey of Current Business 


75. Uma determinada série temporal indica o valor total anual, em dólares, 
de um conjunto de utilidades. (a) Descrever como pode ser ajustada a série 
temporal dé modo a serem eliminados os efeitos da variação do valor do dólar de 
ano para ano. (b) Justificar, tedricamente, o método empregado no item (a). 
(e) Iustrar com um exemplo. 


76. (a) Deflacionar a série temporal da última coluna da Tabela 16:45 
do Capítulo 16 e (b) explicar o significado dos dados deflacionados. 


77. Provar que ö método de deflação de -séries temporais, empregado por - 


exemplo no Probl. 39, é estritamente aplicável apenes quando os números ini 
dices satisfazem ào teste de reversibilidade dos fatôres. 


Problemas Diversos 


78. A Tabela 17.27 apresenta os preços por atacado è as quantidades de pro- 
dutos cereais, nos Estados Unidos, durante os anos de 1949 e 1958. Tôdas as 
quentidades estão em milhões de bushels, exceto as de arroz que estão em milhões 
de libras. Todos os preços estão em dólares por buahe], exceto o de arroz que está 
em dólar por libra. - Admitido 1949 como o ano básico, calcular um número índice 
de preço por atacado, para 1958, mediante o emprêgo de (a) método agregativo 
simples; (b) média (aritmética) simples de relativos; (c) média (geométrica) 
simples de relativos; (d) índice de Laspeyres; (e) índice de ‘Paasche; (f) índice 
ideal de Fishtr; (9) índice de- Marshall-Edgeworth; (h) média aritmética pon- 
derada, admitidos como pesos os valores do ano dado. à 


Resp.: (a) 93,5; (b) 95,7; (c) 95,3; (d) 95.3; te) 95,3; (9) 95,3; (9) 95,3; 
(h) 95,5. 


“79. Adotado 1949 para ano básico, calcular um número índice de volume para” 


1958, usando os dados da Tabela 17.27 do Probl. 78 e cada um dos métodos («) 
a (h) do problema anterior. 
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Tabela 17.27 


1949 1958 
Preço Quantidade Preço Quantidade 
Cevada 1,39 237 124 470 
Milho 1,24 3238 1,15 . 3800 
Aveia 0,72 1220 0,65 1422 
-Arroz 0,086 4077 0,097 4702 
Centeio ` 1,42 18,1 1,27 32,5 
Trigo 2,24 1098 A 2,23 1462 


Fonte: Survey of Current Business 


Resp: (a) 120,2; (b) 143,4; (0) 139,8; (d) 125,5; (0) 1255; (9) 1255; 
(9) 125,5; (A) 127,7. Ea 


80, Provar que, se os números índices de Laspeyres e Paasche forem iguais, 
êles serão também iguais os números índices de Marshall-Edgeworth e ideal 
de Fisher. 


81. Organizar uma tabela dos vários tipos de números índices, especificando, 
em cade caso, se éles satisfazem ou não aos testes de reversibilidade do tempo, de 


reversibilidade dos fatóres e circular. 


NDICES 


< 


ga) 
m 
<. 


ii 
f 


E APÊNDICE I 


Es 


ORDENADAS (Y) 


DA 
CURVA NORMAL = 
REDUZIDA Y 
em z 0 z 

z o i 1 2 3 4 5 8 T 8 9 
00 0,3989 0,3989 0,3989 0,3988 0,3986 0,3984 0,3982 0:3980 0,3977 0.3973 
0,1 3970 3965 3961 3956 3951 3945 3039 3032 3925 3918 
02 3910 3902 3894 3885 3R76 3807 3857 4847 3836 3825 
03 3814 3802 3790 3778 3765 8752 3739 3725 3712 2697 
04 3683 3668 -3653 3637 3621 3605 3580 3572 8505 3588 
0,5 3521 3503 3485 3467 3448 3429 3410 3391 8372 3352 
0.6 3332 3812 3292 3271 3251 3230 32097 3187 3166 Biia 
9T 3123 3101 3079 3056 3034 301% 2989 2960 2943 2920 
0.8 2897 2874 2850 2827 2803 2780 2756 2732 2709 2885 
0,9 2661 2637 2613 2589 2565 2541 2516 2492 2408 2444 
10 2420 2396 2371 23AT ` 2323 2299 2275 2251 2227 2203 
Lt 2179 2155 2131 2107 2083 2059 2036 2012 1989 1965 
1a 1942 1919 1895 1872 1849 1826 1804 1781 1758 1736 
1,3 1714 1691 1669 1647 1626 1604 1582 1561 1539 1018 
14 1497 1476 1456 1435 1415 1394 1374 1354 1334 1315 

1295 1276 1257 1238. 1219 1200 1182 1163 1145 127 

1109 1092 1074 1057 1040 1023 1006 0989 0973 0957 

0940 0925. 0909 0893 0878 0863 0848 0833 0818 0804 

0790 0775 0761 oras 0734 0721 0707. „0094. 0681 0669 

0656 0644 0632, a 0620 0608 0596 0584 0573 0562 "0551" 

Ee) 
20 0540 0529 0519 0508 0498 0488 0478 0408 0459 0449 
2,1 0440 0431 0422 0413 0404 0396 0387 0379 0371 0363 
22 0355 0347 0339 0332 0325 0317 0310 0303 0297 0290 
23 + 0283 0277 0270 0264 0258 0252 0246 0241 0235 0229 
24 0224 0219 0213 0208 0203 0198 0194 0189 0184 0180 
2,5 0175 ol7L 0167 0163 0158 0154 0151 0147 0143 0139 
28 0136 0132 0129 0126 0122 0119 0116 0113 0110 0107 
27 0104 0101 0099 0096 0093 0091 0088 0086 0084 o081 
28 0079 0077 0075 0073 0071 0069 0067 0065 0063 0061 
29 0060 0058 0056 0055 0053 0051 0050 0048 0047 0046 
30 0044 0043 0042 0040 0039 0038 0037 0036 0085 0034 
31 0033 0032 0031 0030 0029 0028 0027 0026 0025 0025 
32 0024 0023 0022 0022 0021 0020 0920 0019 0018 0018 
3,3 0017 0017 0016 0016 0015 0015 0014 0014 0013 0013 
3,4 9012 0012 0012 0011 ooit 0010 0010 0019 0909 0009 
3,5 0009 0008 0008 0008 0008 0007 0007 0007 0007 0008 
3,6 0006 0006 0006 0005 0005 0005 0005 0005 0005 0004 
EMA 0004 0004 2004 0004 0004 0004 0003 0003 0903. 0003 
3,8 0003 0003 0003 2003 0003 0002 x 0002 0002 0002 
39 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 9,0002 0,0002 0,0001 0,0001 
ss 


| APÊNDICE HI 
i 
i a 
; E | 
É VALORES DOS PERCENTES (iz) | 
| subtendida pela ~ s à : da 
CURVA NORMAL DISTRIBUIÇÃO t DE STUDENT , 
REDUZIDA . “com » graus de liberdade 
de Gas O (área sombreada = p) p 
i S $ i to,75 10,70 to,g0 t0,66 
z o 1 2 3 4 5 6 7 8 9 10,99 tom | 0,95 to,90 0,80 | "j . | 
q - | É | 
5 7? 0,325 0,158 
i a 308 | 1376 | 1000 | 0427 ; 
oo | o0000 | 00040 | 0,080 | 00120 | 00160 | 00199 | 00289 | 00279 | 00819 | 0,0359 ea sa 189 | 1081 | 0816 sr 280 a 
01 0398 "0438 0478 0517 0557 0596 0636 0675 0714 0754 454 318 | 2,35 1,84 0,978 0,768 8 271 134 
%2 0793 0832 0871 0910 0948 0987 | , 1026 1064 nos 1141 378 278 238 158 | 09 | O74 569 
É 63 | 179 1217 1256 maa al 1368 1408 1443 1480 1517 a o 
3 oa 1564 1591 16; 17 1808 1844 1879 
i age | 2s |U Las | ogro | our | ogsa | gs ana 
; i i y 194 144 E i 
0,5 1915 1950 1985 2019 2054 2088 2123 2157 2190 2224 : E] 53 vao 1,42 806 ni 549 ao a : 
06 2258 2207 2324 2357 2389 2422 2454 | 2486 2518 2549 2:90 2,31 1,86 1,40 889 706 546 2a: E 
0,7 2580 2612 2642 2673 2704 | 2734 2764 2794 2823 2852 282 226 í 1,38 883 703 543 
TE IE IE IE E E E EGE E a i | 
,9 3 212 3 3315 | 3340 3365 3389 ; - 
| “| l m| g| oaoa g|] a) B| m| B 
10 aaa | mas | aser | sass | 2508 | ssai | asss | as77 22 | Dol le | iss) s | 6 539 | 250 yas 
Tl 3643 3865 3686 3708 3729 3749 3770 3790 se 216 77 135 870 694 538 59 a 
12 3849 3869 3888 3907 3425 3944 3962 3980 aa 214 176 1,34 868 692 ar 258 
18 4082 40an 465 4082 sono ás 4131 4147 "i ' É 
14 9 4207 22 2 51 4265 4279 | 4292 
$ 260 | 248 | azs | agi EM E3 53s 285 io 
15º 4332 4345 4357 4370 4382 | 4394 408 | 4418 ao zar T pE 863 689 534 257 is 
16 4452 4463 4474 4434 4495 4505 4515 4525 2,85 2,10 1,73 1,38 362 088 534 257 E 
117 4554 4564 4573 4582 4591 4599 4808 4616 24 209 1.73 133 861 688 538 257 |; 
18 3841 asia 4656 eea sn 4678 4686 4603 Q ; 4 
Ho 4718 18 4726 473: 478: 4744 4750 4756 o 
P a| 20| | l| w| g) aj al] g 
20 am | sms | aves | azg | avos | arog | amos | asos 252 | 208 | 1 | ta 858 086 532 256 ar 
| 2 agi 4826 4830 4834 4838 aga | 4846 4850 +] 07 E 132 858 685 532 256 iz 
H 2,2 4861 4864 4858 4871 4375 4878 4881 4884 io 2:06 L71 1,32 857 685 531 256 
i 23 4893 1806 | 4898 4901 4904 | a906 | 4909 491) 24 E r ' 
À 24 4018 4920 4022 4925 4927 4929 4931 4032 256 127 
E 248 2,06 La 132 ea sa ER TA 127 
i 2,5 4o38 | aoo | sosi | 4043 | 4045 | 4946 | 4948 | soaa 2,48 2o ia L31 855 684 531 256 127 
| 28 4953 4955 4956 4957 4959 4900 | “496 4062 ao 23 120 181 855 ess 530 266 127 
| 27 4965 | 4966 | 4987 4968 | 4069 | 4970 | 4971 4972 Di A 170 1:81 854 683 530 256 127 
1 28 4974 4975 | 4076 4977 4977 4978 4979 4979 +46 2,04 r 
| 28 4081 | 4982 | 4082 4083 4984 4984 4985 4985 197 
| 275 | 24 204 | 170 so s| s| BO | 2s 126 
3,0 4987 EUA 4987 4988 4988 4989 4989 4989 2,70 2,42 a es 130 848 879 527 254 126 
31 4990 4991 4991 4991 4992 | 4992 4992 4992 2,68 2,39 2,00 16 tão 245 877 526 254 126 
32 4993 4993 4994 4994 4994 4994 - 4994 4995 2,62 2,36 nee iso 1,28 842 674 524 253 128 
33 a005 | 4o95 | 4905 | 4995 | 4996 | 4996 | 4995 | 4906 2,58 233 196 | 1,64 
34 4997 4997 4997 4997 | 4997 | 4097 | 4997 | 4997 j 
ri: Ştaiistic > Biologicol, Agricultural and Medicel 
3 a Fonte: R. A. Fishèr e F. Yates, Statistical Tables for al, ! 
a foao eoo | aooo | 40o $099. | 4909 g? Research (Bth edition), Table II, Oliver and Boyd Ltd., Edinburgh, com permissão 
ENA 4999 4999 4999 4999 4999 4999 * dos autores e editôres. P 
38 4999 4999 | 4999 | "4099 | 4999 4999 à 
39 0,5000 | 0,5000 | 0,5000 | 0,5000 | 0,5000 f 0,5000 
à 
562 563 


APÊNDICE IV 


VALORES DOS PERCENTIS (x,?) 


da 


“ DISTRIBUIÇÃO DE QUI QUADRADO 


com » graus de liberdade 
(área sombreada = p) 


<. APÊNDICE V 


LOGARITMOS COMUNS COM QUATRO DECIMAIS 


ta 


Partes Proporeionais 


gs 4 5 6 7 


2 2 2 
Xo,095 | Xo,09 | X0,975 


1 788 6,63] 5,02 
2 | 108| 02) 738 
3 | 128) 11,8] 0,35 
4 | 49) 138] ul 
5 | 167) 151) 12,8 
6 | 185| 16,8) J44 
7 | 20,3] 18,5] 160 
8 | 220| 201) 17,5 
9 | 286] 217) 190 

10 | 252) 232) 20,5 

u | 268] 247| 219 

12 | 28,3] 262] 282 

13 | 298] 277| 247 

1 | 313) 291 „1 

15 30, 7 

16 | 343| 320] 28,8 

17. | 367| 334| 30,2 

18 | 372| 348] 31,5 

19 | 386] 36, Ê 


rega 
PERT 
E 


Fonte: Catherine M. Thompson, Table of percentage points of the x? distribution, Biometrike, 
Vol. 32 (1941) com permissão dos autores e editóres, 


sto 
10 | 0000 
3 josia 
12 | 0792 
13 | 1139 
14 | 1461 
15 | 1761 
16 | 2041 
17 | 2304 
18 | 2558 
19 | 2788 
zo | 3010 
21 | 3222 
22 | 3424 
23 | 3817 
24 | 3802 
25 | 3979 
26 | 4150 
2y | ams 
28 | 4472 
29 | 624 
so [am 
31| 4914 
82 | 5051 
33 | 5185 
34 | 5316 
35 | 5441 
———86"[-5563 
37 | 5682 
38 | 5798 
39 | 5911 
so 
41 
42 
43 
44 
45 f a532 
46 | 6028 
47 | 6721 
4g |6812 
as | 6902 
se |8990 
51 | 7076 
52 | 7160 
53 |3243 
4 {7228 


CETTE 
none 


Hemmm mm DNS VVV VVV 
meme  crtosotõos sra GO 


KALICO 


de ue te t 
woww 


minto 


pe patio 
OTS 


12 17 21 25 29 
11 15 19 23 28 
10 14 17 21 2 
10 13 16 19 23 
9 12 15 18 21 
su 14 17 20 
8 11 13 10 18 
7 10 12 15 17 
7 9 12 i4 16 
7 91 13 16 
6 8 1 13 15 
6 B 10 12 lá 
6 8 10 12 lá 
6 7 9 1 13 
s 7 911 12 
5 791 12 
5 7 810 1 
5 6 8 9 1 
5 6 8 9 UM. 
4 6 7 910 
4 6 7 9.10 
4 6 7 830 
45 780 
45 6 89 
4 5 6 8 9 
$ 7.8 
de Aa, 
3 T8 
3 7 8 
3 78 
34568 
Ee o SBGEO 
34 5 6 7 
34 5 6 7 
Pod 8 BT 
34 5 6 7 
3 4 5,6 7 
3 4 5 5 6 
34 4 5 6 
3 44 5 6 
33 4 5 6 
3 3 4 6 6 
2 3 4 6 6 
2 3 4 6 6 
2 3 4 5 6 


9 
8 
8 
8 
8 


RERET 
pope 


CERERI 
EER 


VALORES DE e> 


a $ 
E E Ra 6, = Portes Proporcionsis i 
N US S A a S. ae 8, 9) E d e 
ia i cid E A 
s5 {7404 7412 7419 FAST 7435 | 7443 7451 7459 7406 7474 TOE G 2 3 4 5.5 6 7 NS 
g5 [Tiga 7490 7497 “7505 7513 | 7520 7528 7538 7543 7551 | 172 2 345567 (O < 3 
57 |7559 7568 7574 7582" 7589 7597 7804 7612 7619. 7627 122 3 4 5 5 6 7 ` 
38 |7634, 7042 7649 7657 7664 7672 7679 7686 7694 7701 COR CT A E GR e 7 T 
gs |7634. Tie mrs meai 738| Tras 7752 1760 7767 TIT | 1,1 2 3 é 4 56 7 A A i à 3 i 5 6 7 8 2 
60 7182 o do Faos a o a gea: 7839 7846 1 123 4 4 5 8 8 + ` 1 
o 7858 7860 75 78 7: 7896 7 7910 7917 11 Rr 34 4 56 6 A 
eL |7853 Tosi 7998 7945 7052 | 7959 7066 7973 TO8O 7987 | 1 1 2 334566 oo | 100007 | 09900 | 09802 | 0,9704 0,9808 | 09512 | 09818 | 9824 “sas 02370 
62 |7924 Zgo soo7 sls dom | 8028 soss anal eose soss |i 1 2334535 8 00 | Asos | Boss | 6860 | azai | geo | Sres 8521 7 | 8353 3270 
é | gos) 8069 8075 8083 8089.| 8096 8102 8109 816 g2 |1 132334 5 5 6 02 8187 8106 8025 7945 7866 7788 mi 7834 Tás 
03 7408. 7334 7261 7189 7118 7047 6977 8907 8839 
0,4 8703 6636 6570 6505 6440 0376 6313 6250 6188 8126 
e fam um me me melee po pe pa amla pz ggiggi 
e6 |8105 8202 82 2 S Bo 8248 8254 | 1 1 2334 5 5 6 5 
os jars s202 Bora 6380 szer | 6205 $299 sso saiz sao | 1 i 23 4 4 5 56 os sese | sr | sro | sna | sess |. Sose o 
e7 |820 casi gasa goma aasi | 6357 sos duro gae siz | 1 1 3 3 dg 45 6 | 08 2538 
68 |as Agos Sdo 8407 Sold |8420 8426 8492 8439 Bas | 1 1 2 234 4 5 6 07 2107 
: ' os 3716 
zo | easi gas7 8463 Sayo Bave | sasz siss saos 8500 8506 | 1 1 2 2 5 4 q 58 
70 |gs Sgio 6526 ssar 6587 | 8545 8549 8655 sser sez j.t 1 2 2 5 4 4 5 5 SAR 
71 |S Sero asss aso 597 | 8608 soy sers OD! geaz | i 1 2 2 5 4 4 5 5 
72 | BS Soso seis gesi 6987 | 5058 aa sers sest sese | 1 1 2 3 3 4 455 
73 | fasa a/o 8710 8716 |8722 erv 8733 8739 8146 | 1 1 2 2 3 4 4 6 5 
vs | evsı arse sez stes srra |8779 sss 8m1 szor sso | 1 1 22 3 5 4 ss 
75 |8751 Gli asz 0525 5851 |8637 Sez 5848 Basa sso | 1 12 2 dd q OE D : 
% | 8865 8871 8876 8882 8887 | 8893 8800 8004 8910 3915 | 1 1 2 2 3 3 4 4,6 A =1, 2,3, , 10) 
77 | Nos Ses gəs2 goss sds | so sosa soso 8905 si | 1 1 2 2334 aos 
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APÊNDICE VIN 


a DEDUÇÃO DAS EQUAÇÕES NORMAIS 
DA RETA DE MÍNIMOS QUADRADOS 


Seja a equação da reta de mínimos quadrados desejada, 
Y = œ + aX. Os valores de Y` dessa reta, correspondentes a 
X = Xa o Xy são do + Xn do + Xn do + aX y, en- 
quanto os valores reais são Yao Ya ..., Yy respectivamente. Então, 
a reta de mínimos quadrados é tal que (ver Pág. 365) 


S = (ao + ma Ki YaF + (00 + aX Y} +... + (at An Yny 


é um mínimo. 
De acôrdo com o cálculo infinitesimal, S será mínimo quando, 
as derivadas parciais de S em relação a do e forem nulas. Então: 


ès 2 [a0 + aX; — Y) + (ao + aX: = Y)+.. + 
ao a : 3 


-+ (ao + mXy— Yy))=0 


{E 2 ia + ar Xı — Yı) Xı + (go + aX: — Y) X: + IE 
bebido di + (ap mk = Yy) Xn}: Die cmi ms us 


e essas expressões fornecem, as equações normais desejadas 
Nas +a 2X- 2Y=0 
ao EX +a 2X? BXY = 0 
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